Публикации по теме 'exploratory-data-analysis'
Техническая статья: Полное руководство по исследовательскому анализу данных
Введение в исследовательский анализ данных (EDA) Методы очистки и преобразования данных Описательная статистика для обобщения данных Методы визуализации данных для EDA Пример рабочего процесса EDA в Python
Исследовательский анализ данных (EDA) является важным методом для понимания и анализа данных в области науки о данных. EDA помогает вам исследовать структуру ваших данных, выявлять закономерности и выбросы, а также получать представление о ваших данных, которое может помочь в..
Создание автоматизированного прогнозатора увольнения сотрудников для начинающих с помощью Streamlit, Pandas Profiling…
Введение:
В этой статье для начинающих мы рассмотрим процесс создания конвейера автоматизированного машинного обучения (ML) для прогнозирования увольнения сотрудников. Мы будем использовать возможности Streamlit, Pandas Profiling и PyCaret для разработки интуитивно понятного веб-приложения, которое позволит пользователям загружать данные HR, выполнять автоматизированный исследовательский анализ данных (EDA), обучать модели машинного обучения и прогнозировать увольнение отдельных..
Комплексный проект сквозного машинного обучения — бронирование отелей отменено? или нет?
Отмена бронирования отелей может стать головной болью как для путешественников, так и для владельцев отелей. Но что, если бы существовал способ предсказать их до того, как они произойдут? Машинное обучение может помочь. В этой статье мы подробно рассмотрим сквозной проект машинного обучения, который использует исторические данные о бронировании отелей, чтобы предсказать, будет ли бронирование отменено или нет.
Во-первых, мы сформулируем проблему и посмотрим на общую картину, обсудив,..
Практический пример: прогнозирование повторной госпитализации пациента в связи с диабетом в некоторых больницах
Введение:
Диабет — одно из заболеваний, рост которых связан с массовой урбанизацией и резким изменением образа жизни во многих странах. Ожидается, что к 2030 году он станет седьмым по распространенности фактором смертности. Таким образом, диабет находится на повестке дня в области здравоохранения в большинстве развитых и развивающихся стран. Повторная госпитализация является важным показателем качества медицинской помощи. Она помогает нам определить уровень качества обслуживания,..
Исследовательский анализ данных в Python
Вступление
Когда новички подходят к своей первой проблеме машинного обучения промышленного уровня, они, очевидно, сталкиваются с трудностями при работе с наборами данных. Если наборы данных несбалансированы, новичкам становится очень сложно разобраться в вещах и найти закономерности в объектах набора данных. Когда мы пытаемся применить модель машинного обучения к набору данных для прогнозирования результатов, тогда ответственность за обработку данных ложится на инженера...
Исследовательский анализ данных (EDA)
Само название этой темы говорит о многом. Исследовательский анализ данных заключается в анализе и изучении данного набора данных путем понимания различных аспектов набора данных и его визуализации.
Теперь у вас возникнет один вопрос: почему я должен выполнять исследовательский анализ данных (EDA) перед очисткой своих данных и моделей обучения в машинном обучении и глубоком обучении? Какая в этом необходимость? Ответ очень прост: перед очисткой данных вы должны знать, о чем именно данные..