Машинное обучение — это отрасль искусственного интеллекта (ИИ) и информатики, в которой используются данные и алгоритмы для обучения компьютерной программы обучению на основе данных и прогнозированию на основе полученных данных. Машинное обучение — это исследование, направленное на то, чтобы сделать машины более похожими на людей в их поведении и решениях, дав им возможность учиться и разрабатывать свои собственные программы. Это делается с минимальным вмешательством человека. Процесс обучения автоматизирован и улучшен на основе опыта машин на протяжении всего процесса.

Есть разница между традиционным программированием и машинным обучением. В традиционном программировании мы передаем ввод в виде набора инструкций машине для генерации вывода. В то время как в машинном обучении мы подаем входные и выходные данные для обучения модели обучения. Основываясь на нашей обученной модели, мы получаем прогноз от машины к вновь прибывшим/невидимым данным.

Чтобы проиллюстрировать разницу между традиционным программированием и машинным обучением, приведенный ниже рисунок поможет лучше понять.

Методы машинного обучения

Машинное обучение подразделяется на три категории.

  1. Контролируемое обучение
  2. Неконтролируемое обучение
  3. Полуконтролируемое обучение
  4. Контролируемое обучение

Контролируемое обучение, в котором данные помечены (помечены как входные данные, уже помеченные правильным выходом), используемые для обучения. А после завершения обучения каждых данных модель тестируется на основе тестовых данных (подмножества обучающей выборки), а затем предсказывает результат.

Обучение с учителем делится на:

а) Классификация. Различные метки обучают алгоритм идентификации элементов в определенной категории. Например, Болезнь или отсутствие болезни, Пиво или вино.

b) Регрессия: используется для прогнозирования будущих значений, и модель обучается на исторических данных. Например, прогнозирование будущей цены продукта.

2. Неконтролируемое обучение

Неконтролируемое обучение использует алгоритмы машинного обучения для анализа и кластеризации немаркированных наборов данных. В моделях неконтролируемого обучения сами находят скрытые закономерности и идеи из предоставленных данных.

Неконтролируемое обучение делится на:

a) Ассоциация: правило ассоциации используется для поиска взаимосвязи между переменными в большом наборе данных. Например, правила ассоциации используются для маркетинга, например, если клиент А покупает хлеб, он также покупает молоко.

b) Кластеризация: кластеризация в другом термине, используемом для группировки. Объекты, которые имеют одинаковое наибольшее сходство, будут соответствовать одному кластеру, а группа, имеющая такое же, но меньшее или разное сходство, будет соответствовать другой группе.

3. Полуконтролируемое обучение

Полууправляемое обучение — это нечто среднее между контролируемым и неконтролируемым обучением. Он использует комбинацию размеченных и неразмеченных наборов данных в течение периода обучения. Обучение с полуучителем может решить проблему нехватки размеченных данных для обучения алгоритма обучения с учителем.

Этапы машинного обучения

  1. Сбор данных
  2. Подготовка данных
  3. Выбор модели
  4. Обучение
  5. Тестирование
  6. Оценка
  7. Настройка гиперпараметров
  8. Прогноз