За последние несколько месяцев такие инструменты, как chatGPT, Dall-E, BARD и т. д., штурмом захватили мир технологий. Ажиотаж оправдан, потому что модели выполняли увлекательные задачи, такие как генерация статей, написание кода, создание мемов и многое другое. Мы видели, как они ставили под угрозу и некоторые отрасли :(

Все эти модные модели находятся под эгидой генеративного ИИ, и в ближайшие годы он разрушит множество вертикалей. Gartner считает, что GenAI — одна из самых влиятельных технологий, которая совершит революцию в продуктах. Эти достижения побудили меня начать серию блогов о генеративном ИИ. В этом первом мини-блоге я хочу рассказать об основных деталях GenAI, а в следующих блогах мы обсудим его различные типы, модели с открытым исходным кодом и реализуем некоторые практические приложения. ДАВАЙТЕ НАЧНЕМ!!

Что такое Генеративный ИИ?

Генеративный ИИ — это тип технологии ИИ, который создает контент различного типа, включая текст, изображения, аудио и синтетические данные. Основная идея состоит в том, чтобы генерировать полностью оригинальные артефакты, которые бы выглядели как настоящие.

Чтобы представить контекст, в котором GenAI вписывается, обратитесь к изображению ниже —

Модели глубокого обучения или машинного обучения можно разделить на два типа — дискриминационные и генеративные.

Дискриминативные модели обычно тренируются на входных помеченных данных и пытаются определить связь между функцией и метками. Классическая контролируемая и неконтролируемая модель дискриминационного обучения выглядит так, как показано на изображении ниже.

Например, при классификации изображений собак и кошек дискриминационная модель пытается узнать вероятность появления ярлыка (кошка или собака) при заданном входе (изображении). Даже если вы предоставите изображение велосипеда, эта модель может с некоторой вероятностью классифицировать его как кошку. Это означает, что дискриминационная модель как бы сжимает информацию о различиях между кошками и собаками, не пытаясь понять, что такое кошка и что такое собака.

А вот и генеративное моделирование ИИ. Модель GenAI фиксирует совместное распределение вероятностей входных данных и меток. Он изучает распределение отдельных классов и функций, а не границы. Это означает, что когда модель GenAI получает изображение собаки, она может предсказать условную вероятность того, что это собака, а также может создать изображение собаки. Обзор такой модели выглядит следующим образом:

  1. Модель GenAI может создавать новый контент на основе того, что она узнала из существующего контента.
  2. Как только процесс обучения на различных данных завершен, он приводит к созданию модели.
  3. При получении подсказки обученная выше модель GenAI предсказывает, каким может быть ожидаемый ответ, и это создает новый контент.

В зависимости от типа данных модель GenAI различается по своим функциям. Генеративные языковые модели принимают текст в качестве входных данных и могут генерировать новый текст, аудио, изображения и решения. Генерационные модели изображениймогут использовать изображение в качестве входных данных и выполнять такие задачи, как добавление субтитров, поиск изображений, изменение разрешения, создание видео-анимации и т. д.

Для этих генеративных моделей требуются подсказки. Ясность подсказки и качество ввода определяют качество вывода, генерируемого моделью. Как только такая подсказка предоставлена, модель GenAI дает полный вывод, а не полуготовые ответы, что может сэкономить много нашего времени. В заключение,генеративный алгоритм нацелен на целостное моделирование процесса без отбрасывания какой-либо информации. Мы обсудим это подробнее в будущих блогах.

На этом мы подошли к концу этого мини-блога. В следующем мы обсудиммодели генеративного языка, проектирование подсказок, существующие модели с открытым исходным кодом, тонкую настройку и практическую реализацию вариантов использования с кодом. А пока,Ура!!