Публикации по теме 'metrics'


Прогнозирование оттока клиентов с помощью машинного обучения
В управлении продуктом отток является еще одним важным показателем жизненного цикла продукта. Что делать, если этот показатель ухудшается? Во-первых, вы можете предсказать своих клиентов до того, как они уйдут и начнут проявлять инициативу. Очевидно, что стоимость приобретения — это больше, чем инициативы, которые вы бы предложили. Как предсказать отток клиентов? Вам нужны данные. В зависимости от сложности вашей проблемы вам может потребоваться все больше и больше данных...

Метрики оценки в обработке естественного языка — BLEU
В этой серии статей мы собираемся обсудить метрики оценки, характерные для вариантов использования в области обработки естественного языка. Наиболее распространенными задачами в НЛП являются автоматическое обобщение, ответы на вопросы, машинный перевод. Целью этих показателей является определение качества прогнозируемого текста с учетом входного текста. Прогнозируемый текст называется кандидатом, а возможные правильные или целевые тексты называются ссылками. Эти показатели основаны..

Точность-точность-отзыв и многое другое
Понимание того, какой показатель лучше всего подходит для вашей задачи классификации. Почему точность не всегда предпочтительна при работе с несбалансированными наборами данных? Общее заблуждение При построении любой классификационной модели многие люди по умолчанию принимают точность в качестве метрики. Но это ошибка. Чтобы было понятнее, давайте попробуем понять, что такое точность Точность: это мера правильно классифицированных результатов независимо от классов. Его..

ML: кривая ROC, F1-Score, точность, выбор лучших показателей
90% точность не достигает цели Позвольте мне рассказать вам историю стажера-специалиста по данным, который был счастлив использовать алгоритмы машинного обучения на реальных данных после года изучения набора данных Iris, сравнения Sepal.length и Petal.width. Этому стажеру было поручено его первое задание в новой компании. На основе данных о просмотре спрогнозируйте вероятность того, что посетитель вернется на веб-сайт в течение дня. Цель этого прогноза заключалась в том, чтобы..

Представляем Distython. Новый пакет Python, реализующий новые метрики расстояния
У вас когда-нибудь возникала проблема с выбором правильной метрики расстояния для набора данных смешанного типа? В большинстве случаев вы можете попытаться выполнить предварительную обработку функций, а затем использовать некоторые популярные метрики расстояния, такие как Евклидов или Манхэттен. Фактически, этот подход может быть неточным и привести к снижению производительности вашей модели машинного обучения. Взгляните на Distython - пакет Python, который реализует новые метрики..

Коэффициент корреляции Мэтьюза - лучший классификационный показатель, о котором вы никогда не слышали
Поздравляю! Вы создали бинарный классификатор - причудливую нейронную сеть, использующую 128 графических процессоров с их выделенной электростанцией, или, возможно, надежную модель логистической регрессии, которая работает на вашем старом добром ThinkPad. Вы разработали модель и загрузили данные; Теперь, наконец, пришло время измерить эффективность классификатора. Не поймите меня неправильно: кривые ROC - лучший выбор для сравнения моделей. Однако скалярные метрики по-прежнему..