Машинное обучение — это отрасль искусственного интеллекта (ИИ) и информатики, в которой используются данные и алгоритмы для обучения компьютерной программы обучению на основе данных и прогнозированию на основе полученных данных. Машинное обучение — это исследование, направленное на то, чтобы сделать машины более похожими на людей в их поведении и решениях, дав им возможность учиться и разрабатывать свои собственные программы. Это делается с минимальным вмешательством человека. Процесс обучения автоматизирован и улучшен на основе опыта машин на протяжении всего процесса.
Есть разница между традиционным программированием и машинным обучением. В традиционном программировании мы передаем ввод в виде набора инструкций машине для генерации вывода. В то время как в машинном обучении мы подаем входные и выходные данные для обучения модели обучения. Основываясь на нашей обученной модели, мы получаем прогноз от машины к вновь прибывшим/невидимым данным.
Чтобы проиллюстрировать разницу между традиционным программированием и машинным обучением, приведенный ниже рисунок поможет лучше понять.
Методы машинного обучения
Машинное обучение подразделяется на три категории.
- Контролируемое обучение
- Неконтролируемое обучение
- Полуконтролируемое обучение
- Контролируемое обучение
Контролируемое обучение, в котором данные помечены (помечены как входные данные, уже помеченные правильным выходом), используемые для обучения. А после завершения обучения каждых данных модель тестируется на основе тестовых данных (подмножества обучающей выборки), а затем предсказывает результат.
Обучение с учителем делится на:
а) Классификация. Различные метки обучают алгоритм идентификации элементов в определенной категории. Например, Болезнь или отсутствие болезни, Пиво или вино.
b) Регрессия: используется для прогнозирования будущих значений, и модель обучается на исторических данных. Например, прогнозирование будущей цены продукта.
2. Неконтролируемое обучение
Неконтролируемое обучение использует алгоритмы машинного обучения для анализа и кластеризации немаркированных наборов данных. В моделях неконтролируемого обучения сами находят скрытые закономерности и идеи из предоставленных данных.
Неконтролируемое обучение делится на:
a) Ассоциация: правило ассоциации используется для поиска взаимосвязи между переменными в большом наборе данных. Например, правила ассоциации используются для маркетинга, например, если клиент А покупает хлеб, он также покупает молоко.
b) Кластеризация: кластеризация в другом термине, используемом для группировки. Объекты, которые имеют одинаковое наибольшее сходство, будут соответствовать одному кластеру, а группа, имеющая такое же, но меньшее или разное сходство, будет соответствовать другой группе.
3. Полуконтролируемое обучение
Полууправляемое обучение — это нечто среднее между контролируемым и неконтролируемым обучением. Он использует комбинацию размеченных и неразмеченных наборов данных в течение периода обучения. Обучение с полуучителем может решить проблему нехватки размеченных данных для обучения алгоритма обучения с учителем.
Этапы машинного обучения
- Сбор данных
- Подготовка данных
- Выбор модели
- Обучение
- Тестирование
- Оценка
- Настройка гиперпараметров
- Прогноз