Вам действительно нужно его использовать?

Машинное обучение (ML) — это не волшебная палочка, которой можно коснуться всех своих проблем и ожидать надежного решения.

Достижения в области машинного обучения с точки зрения точности и скорости заставили нас откровенно подходить к любой проблеме, имея в виду решение, основанное на машинном обучении.

Это опасное мышление, которое может привести к беспрецедентным результатам. Уверяю вас, что вы не хотите беспрецедентных результатов в производстве.

В этой статье мы рассмотрим 4 вопроса, на которые необходимо ответить, прежде чем рассматривать ML как решение вашей проблемы.

1. Есть ли у вас обучающие данные, которые имеют сходные характеристики или закономерности с данными, для которых вы хотите сделать прогноз?

ML — это не магия. Он не может производить без предварительного обучения. Следовательно, первое и главное требование в любой системе ML — это данные. Прежде чем решить, можем ли мы применить ML к проблеме, нам нужно убедиться, что у нас есть доступ к данным.

Но данные, которые мы будем использовать для обучения модели, должны иметь шаблоны, похожие на данные, которые мы хотим предсказать.

Допустим, мы хотим научить модель давать рекомендации фильмов на платформе. Если мы обучим его на данных до 2000 года, то, скорее всего, он не даст хороших рекомендаций, потому что вкусы людей со временем меняются.

В некоторых случаях данные не имеют никакого шаблона. Это следует за чисто случайным процессом.

2. Есть ли более простое решение?

Некоторые проблемы настолько тривиальны, что для их решения не нужна ML-система. В таких случаях следует отдавать предпочтение более простым решениям, поскольку для внедрения решения на основе машинного обучения требуется относительно больше времени и денег.

Рассмотрим задачу прогнозирования продаж, и у вас есть два варианта решения. Один делается путем взятия скользящей средней на основе предыдущих дней и недель. Другая — это модель машинного обучения с десятками функций, рассчитанных с использованием большого объема данных.

Если первое обеспечивает достаточно хорошее решение или уступает модели ML с очень небольшим отрывом, вам, вероятно, следует выбрать более простую модель скользящего среднего. Трата дополнительного времени и денег на модель ML может не стоить небольшого улучшения. Более того, как только вы решите масштабироваться, стоимость развертывания модели машинного обучения может значительно возрасти.

3. Является ли это рентабельным?

Это связано с предыдущим пунктом выбора между более простым решением и сложной моделью ML. Однако в этом случае у вас есть только ML-модель как решение нашей проблемы.

Даже если ML — единственное решение, возможно, вы не захотите его использовать. Вы должны обратить пристальное внимание на денежное вознаграждение.

Создание ML-системы и внедрение ее в производство стоит денег. Если вы работаете с большими объемами данных, что обычно и бывает, затраты резко возрастают.

Сбор, хранение и обработка данных, а также обучение моделей в облаке могут быть гигантскими расходами.

Все сводится к сравнению ценности, которую ML предоставляет для вашего бизнеса, и счета за облако, который вы получаете. Если вы тратите тысячи долларов на эксплуатацию ML-системы в облаке, а ваш бизнес получает от этого очень мало пользы, то вам, вероятно, следует искать лучшее решение.

4. Можете ли вы позволить себе ошибки?

Даже если вы создадите современную модель, которая работает очень хорошо, будут ошибки. Ни одна модель машинного обучения не будет точной на 100%.

Так что вопрос в том, можете ли вы позволить себе совершать ошибки. Подумайте об обнаружении рака на рентгене. Это буквально случай жизненной важности. Доверились бы вы исключительно модели машинного обучения в этой задаче?

Модель машинного обучения можно использовать в качестве вспомогательного документа, но ей нельзя доверять принятие окончательного решения.

Последние мысли

Машинное обучение — это высокоэффективный инструмент, который помогает решать многочисленные проблемы в самых разных сферах бизнеса. Однако это не универсальное решение для любой задачи.

Вопросы, упомянутые в этой статье, необходимо решить, прежде чем вкладывать время и деньги в решение на основе машинного обучения.

Машинное обучение — это здорово, но не всегда ваш лучший друг.

Вы можете стать участником Medium, чтобы разблокировать полный доступ к моим материалам, а также к остальной части Medium. Если вы уже подписались, не забудьте подписаться, если хотите получать электронные письма всякий раз, когда я публикую новую статью.

Спасибо за чтение. Пожалуйста, дайте мне знать, если у вас есть какие-либо отзывы.