Наше пособие по ИИ - это пошаговое руководство по использованию ИИ при запуске или расширении. Вот удобное резюме.

👉️ Загрузить Пособие по ИИ.

Искусственный интеллект (ИИ) - самая важная технология на сегодняшний день. Ведущие стартапы и компании, занимающиеся расширением, используют ИИ, чтобы добиться роста доходов и экономии средств за счет своих конкурентов. Но использование ИИ может показаться пугающим. Как разработать стратегию искусственного интеллекта? Нужна ли мне собственная команда? Какие алгоритмы мне следует использовать?

Наше Пособие по искусственному интеллекту - это образец успеха. Мы объясняем без жаргона передовой опыт в шести основных областях ИИ: стратегии; люди; данные; разработка; производство; и регулирование и этика. Наше исследование обогатилось сотнями дискуссий с ведущими европейскими стартапами в области искусственного интеллекта.

Загрузите Пособие сегодня. Ниже мы предлагаем удобную сводку. Чтобы получить больше информации по любой проблеме, изучите Пособие.

Пособие по ИИ было разработано в сотрудничестве с нашими друзьями из Barclays UK Ventures.

Глава 1: Стратегия 💡

Как выявлять инициативы и определять их приоритеты, оценивать альтернативные стратегии развития, планировать бюджеты и сроки, а также обеспечивать культурную поддержку.

  • Признайте потенциал ИИ в создании ценности. Хотя вам не следует добавлять ИИ в свои инициативы ради этого, вы рискуете потерять конкурентное преимущество, если не исследуете, что ИИ может предложить.
  • Определите проблемы, которые должен решить ИИ. ИИ особенно эффективен при: назначении (определении того, что что-то есть, или степени, в которой элементы связаны); группировка (определение корреляций и подмножеств в данных); генерация (создание изображений или текста на основе входных данных) и прогнозирование (прогнозирование изменений в данных временных рядов). У всех предприятий будут проблемы там, где это применимо, и, следовательно, там, где ИИ может принести пользу.

  • Расставьте приоритеты для проектов в соответствии с их ценностью и жизнеспособностью. Убедитесь, что у вас есть четкое и краткое описание проблемы и желаемых результатов. Оценка жизнеспособности включает рассмотрение того, являются ли ваши данные о тренировке сбалансированными (свободными от предвзятости), исчерпывающими (фиксируют все соответствующие переменные), разнообразными (фиксируют редкие ситуации) и имеют ли они достаточный объем.
  • Сроки создания искусственного интеллекта менее определенны, чем для традиционной разработки программного обеспечения - и обычно увеличиваются нелинейно с желаемой точностью. Сроки варьируются в зависимости от типа проблемы, предметной области и доступности данных. Часто прототип с ограниченной точностью может быть разработан в течение трех месяцев.
  • Согласуйте свой бюджет со своими целями и стратегией развертывания. Бюджет, который требуется для инициативы AI, будет зависеть от множества факторов, включая сложность проблемы, доступность и качество данных обучения, а также выбранную вами стратегию развертывания.
  • Стратегии развертывания ИИ включают: вызов сторонних интерфейсов программирования приложений (API); использование управляемых сервисов искусственного интеллекта от третьих лиц; создание небольшой собственной AI-команды; и создание обширной собственной команды AI. Большая внутренняя команда - это ежегодные инвестиции в несколько миллионов фунтов стерлингов. Многие компании разрабатывают доказательство концепции, используя свои существующие группы разработчиков, сторонние API-интерфейсы или платные сервисы. Затем они создают предложение по бюджету и начинают работу с небольшой собственной командой AI.
  • Ищите спонсорскую поддержку у руководителей высшего звена. Поддержка со стороны руководства будет важна для успеха новых инициатив в области ИИ. Чтобы получить поддержку, ознакомьте высшее руководство с преимуществами ИИ, устанавливая реалистичные ожидания в отношении сроков и результатов.
  • Предвидеть и смягчать культурные опасения по поводу ИИ. Некоторым ИИ будет незнаком. Другие увидят, что их рабочие процессы изменятся. Многие люди могут быть обеспокоены влиянием ИИ на безопасность работы. Зачастую ИИ усиливает роль человека, предлагая «расширенный интеллект». Активно решайте проблемы, выделяя способы, с помощью которых ИИ будет поддерживать индивидуальные цели и позволить членам команды перенаправить свое время на задействованные аспекты своих ролей.

«Ожидайте нетрадиционных соображений безопасности. Защитите себя от злонамеренных действий с помощью тщательного тестирования системы и обработки исключений ».

  • Когда ваш первый проект находится в стадии реализации, предвидите долгосрочные аспекты вашей стратегии искусственного интеллекта. Учтите: техническое обслуживание; данные (бюджет на переобучение вашей системы по мере развития и увеличения данных); развитие алгоритмов (новые методы дадут лучшие результаты в будущем); масштабирование (распространение полезных систем искусственного интеллекта на дополнительные бизнес-единицы и регионы); инновации (дорожная карта для новых инициатив в области ИИ); и регулирование (стратегия соблюдения нового законодательства по мере его появления).

Глава 2: Люди 👩

Как понять роли в команде ИИ; структурируйте команду для достижения поставленных целей; а также находить, оценивать, привлекать и удерживать лучшие таланты в области ИИ.

  • В искусственном интеллекте названия должностей различаются, и их трудно интерпретировать. Мы описываем характеристики и зарплаты для шести ключевых ролей: инженер по данным / машинному обучению; Специалист по данным; Исследователь машинного обучения; Руководитель отдела данных; Руководитель отдела исследований / AI; и главный научный сотрудник / главный научный сотрудник. Для каждого из них возможности людей различаются в зависимости от компетенции в области исследований, разработки, производства и стратегии.
  • Состав вашей команды должен зависеть от решаемой проблемы и вашего подхода к ее решению. Однако рекомендуется избегать найма сольных талантов. Начните с небольшой команды и убедитесь, что у вас есть надежная стратегия ИИ, прежде чем расширять свой штат ИИ.

«Большинство специалистов по обработке данных ищут работу, которая« изменит ситуацию ». Чтобы привлечь таланты, продемонстрируйте, как это работает у успешного кандидата ».

  • Рекрутеры, конференции и университеты - главные источники талантов. Традиционным агентам по найму сложно отбирать кандидатов с искусственным интеллектом, поэтому обращайтесь к специалистам по подбору персонала. Конференции и встречи - мощные средства для привлечения талантов; быть активным в сообществе ИИ, посещать конференции и выступать на них, а также расширять свою сеть, чтобы находить способных кандидатов. Взаимодействовать с университетами; размещать на своих досках вакансий, устанавливать партнерские отношения и оплачивать проекты, чтобы привлечь студентов, которые могут искать вместе с вами возможности в будущем.
  • Разнообразие обеспечивает экономическую ценность и конкурентное преимущество. Изучите культуру своей компании, команду ИИ и методы найма, чтобы обеспечить разнообразие, представительство и вовлеченность.
  • Эффективное описание должности должно подчеркивать проекты (характер обязательств, над которыми будет работать успешный кандидат), навыки и влияние. Большинство специалистов по обработке данных ищут работу, которая «изменит ситуацию». Чтобы привлечь талантливых специалистов, продемонстрируйте, как это работает у успешного кандидата.
  • При приеме на работу расставляйте приоритеты в способных к адаптации лицах, решающих проблемы. В дополнение к определенным ролевым и техническим навыкам сильный кандидат в области ИИ будет: понимать доступные инструменты, позволяющие проводить быстрые исследования и разработки; цените, когда выпускать несовершенное решение, а когда ждать; и хорошо общаться и сотрудничать.
  • Оптимизируйте каждый этап воронки набора. В Главе 2 Руководства мы приводим лучшие практики для: проверки резюме; проверка телефона; техническое тестирование; личные интервью и последующие действия после интервью
  • Талантов искусственного интеллекта не хватает. Задачи, культура и компания - вот ключевые факторы удержания. Помимо привлекательного финансового пакета, подумайте о: предложении гибкого рабочего времени; предлагая сложные задачи и сводя к минимуму утомительную работу за счет автоматизации; создание культуры, в которой разделяются различные идеи; избегание «одиноких работников»; обеспечение того, чтобы ваша команда ИИ получила признание за свою работу; и поддержка публикации и презентации работ членами команды.

«Структурируйте свою команду, чтобы избежать одиночек. Профессионалы в области искусственного интеллекта полагаются на сотрудничество ».

Глава 3: Данные 🛢

Как разработать стратегию обработки данных для ИИ, ускорить сбор данных, структурировать и предоставить данные, разработать ценный набор данных и минимизировать предвзятость.

«Данные - это жизненная сила любой системы искусственного интеллекта. Без него ничего не происходит ». Дэвид Бенигсон, Сигнал

  • Для эффективного ИИ разработайте стратегию данных. Стратегия данных включает: сбор и обработку данных; качественный; контекст; место хранения; обеспечение; и управление и безопасность. Определите свою стратегию обработки данных в самом начале своей инициативы в области искусственного интеллекта.

  • Ускорьте сбор данных за счет использования нескольких источников. Разработчики используют несколько источников, в том числе: бесплатные ресурсы (например, агрегаторы наборов данных); партнерство с третьими сторонами (компаниями, университетами, поставщиками данных и правительственными ведомствами); и новые собственные данные.
  • Высококачественный набор данных обладает характеристиками, подходящими для решения ваших бизнес-задач, сводит к минимуму предвзятость и предлагает данные для обучения, помеченные с высокой степенью точности. Разработайте сбалансированный набор данных - если у вас значительно больше выборок одного типа выходных данных, чем другого, ваша система будет демонстрировать предвзятость.
  • Основные формы систематической ошибки: необоснованная корреляция (между входными и выходными классификациями); ошибочные предположения, которые приводят к тому, что отношения теряются («недооценка»); и моделирование шума вместо достоверных выходных данных («переоснащение»). Отрегулируйте переоснащение или неполное соответствие, используя различные объемы данных и структуры модели. Удалите необоснованные корреляции путем тестирования.

«Убедитесь, что результаты вашего внутреннего тестирования будут сохранены при применении к реальным данным. Проверяйте заранее и часто на реальных данных ».

  • Управление "грязными данными" - самая серьезная задача специалистов по данным (Kaggle). Меньшие объемы релевантных, хорошо размеченных данных обычно обеспечивают более высокую точность модели, чем большие объемы некачественных данных. Чтобы эффективно маркировать данные: подумайте о разработке вспомогательной системы для ускорения маркировки данных и повышения точности; использовать существующие технологии искусственного интеллекта и обработки данных; и искать данные, помеченные несколькими людьми, чтобы избежать неправильной маркировки.
  • Узнайте, какие данные вы используете. Убедитесь, что вы собрали человеческие знания о том, как собирались ваши данные, чтобы вы могли принимать последующие решения относительно их использования. Захватите происхождение данных (откуда возникли ваши данные и как они были собраны). Определите свои переменные (различите необработанные данные, объединенные данные, метки и выводы). Разберитесь в системах и сопоставлениях, через которые проходят ваши данные, чтобы сохранить детали.
  • Храните и структурируйте данные оптимальным образом для достижения ваших целей. Варианты хранения включают базовое файловое, реляционное, NoSQL или их сочетание. При выборе плана хранения для увеличения объема данных, обновлений, устойчивости и возможности восстановления.
  • Каждый третий специалист по данным сообщает, что доступ к данным является основным препятствием для продуктивности (Kaggle). Разработайте стратегию обеспечения, которая: обеспечивает доступ к данным в вашей организации при необходимости; содержит меры предосторожности для защиты вашей компании от несчастных случаев; оптимизирует ввод / вывод системы; и поддерживает актуальность данных.
  • Внедрите надежные процедуры управления данными и обеспечения безопасности в соответствии с местными и международными правилами. Личные данные защищены законодательством Великобритании и ЕС, и вы должны хранить их в надежном месте. Используйте принципы надлежащего хранения, передачи и минимально необходимого доступа.

Глава 4: Развитие 🔧

Как: оценить различные подходы к разработке ИИ; выбрать фурнитуру; выбрать подходящие техники ИИ; и оценить популярные платформы глубокого обучения.

  • Ваша компания может использовать ИИ разными способами. использовать сторонние API-интерфейсы AI; аутсорсинг; использовать управляемый сервис; построить внутреннюю команду; или воспользуйтесь «гибридным» подходом, сочетающим внутреннюю команду со сторонними ресурсами.
  • Сторонние API-интерфейсы AI выполняют определенные функции в соответствии со средними или высокими стандартами при невысокой стоимости. Большинство из них решают проблемы в области видения и языка. Многочисленные API доступны от Amazon, Google, IBM, Microsoft, а также от других небольших компаний. Возможности различаются; мы даем краткое изложение на страницах 47–50 Пособия. API-интерфейсы предлагают немедленные результаты без предварительных вложений за счет настраиваемости и дифференциации. Используйте API, если вы ищете решение общей проблемы, для которой доступен API. API-интерфейсы не подходят, если вы ищете решения узких проблем, специфичных для предметной области, хотите настроить свой ИИ или стремитесь к долгосрочной дифференциации с помощью ИИ.
  • Управляемые сервисы позволяют загружать данные, настраивать и обучать модели с помощью простого интерфейса и уточнять результаты. Управляемые сервисы устраняют большую часть сложностей разработки ИИ и позволяют быстро разработать индивидуальное решение . Управляемые сервисы предлагают большую гибкость и контроль, чем API-интерфейсы, но меньшую гибкость, чем внутренняя команда, а также требуют передачи данных третьей стороне и могут создавать зависимости.
  • Если стороннее решение недоступно, а собственная команда стоит слишком дорого, вы можете передать разработку ИИ на аутсорсинг. Уместность аутсорсинга будет зависеть от вашей области знаний, опыта, необходимого времени для оценки и конфиденциальности данных. При аутсорсинге укажите желаемые структуры и стандарты, которые предоставят данные по обучению, затраты, сроки и рекомендации по развертыванию. Аутсорсинг, если вам нужен надежный опыт быстро и более дешевый вариант, чем постоянные сотрудники. Избегайте аутсорсинга, если ваши права доступа к данным запрещают это, вам требуются знания домена или сектора, которых нет у аутсорсера, или вы хотите накапливать знания в своей собственной компании.
  • Собственная команда AI предлагает максимальный контроль, возможности и конкурентное преимущество - по цене. Небольшая штатная команда будет стоить от 250 000 до 500 000 фунтов стерлингов в год. Большая команда требует ежегодных вложений в несколько миллионов фунтов стерлингов. Чтобы создать внутреннюю команду, ваша компания также должна: привлекать, управлять и удерживать таланты в области ИИ; выбрать рамки и методы разработки; собирать и очищать данные; узнать, как внедрить ИИ в реальные системы; и соблюдать нормативные и этические стандарты. Создайте внутреннюю команду, если у вас есть проблема, которую нельзя решить с помощью существующих решений, вы стремитесь к дифференциации на рынке или хотите сохранить контроль над своими данными.
  • «Гибридный» подход идеально подходит для многих компаний. Запланируйте создание собственной команды, которая со временем будет соответствовать вашим требованиям в соответствии с высокими стандартами, но с использованием сторонних API-интерфейсов для решения начальной, более простой версии ваш вызов. Гибридный подход может быть привлекательным, если вы стремитесь к быстрым первоначальным результатам, хотите ограничить расходы до тех пор, пока не будет доказано экономическое обоснование, и хотите большей дифференциации и устойчивости с течением времени.

«Гибридный подход дает мне гибкость. Мне не нужно изобретать велосипед, и я могу сосредоточиться на выполнении очень конкретных задач лучше, чем кто-либо в мире ». Д-р Джанет Бастиман, StoryStream

  • Для самостоятельной разработки ИИ у вас есть выбор в отношении своего «стека технологий» ИИ. Стек состоит из шести уровней: аппаратного обеспечения; операционные системы; языки программирования; библиотеки; каркасы; и абстракции. Не для всех задач требуется полный стек.
  • Убедитесь, что у вашей команды есть оборудование с графическими процессорами (GPU), поддерживающими библиотеки NVIDIA CUDA. Ноутбуки с высокопроизводительными видеокартами предлагают гибкость. Для большей мощности предпочтительны настольные компьютеры с мощными графическими процессорами. Для обучения больших моделей используйте выделенные серверы. Облачные серверы, предлагаемые Amazon, Google или Microsoft, подходят для большинства компаний на ранней стадии развития.
  • Применяйте методы искусственного интеллекта, подходящие для вашей проблемной области. Для проблем с присваиванием рассмотрите: классификацию опорных векторов; Наивный Байес; K-классификация ближайшего соседа; Сверточные нейронные сети; Регрессия опорных векторов; или техники «лассо». Мы описываем каждый из них и объясняем их преимущества и недостатки. Для группировки задач изучите: Кластеризация со сдвигом по среднему значению; К-средние; и модели гауссовой смеси. Для генерации рассмотрите: вероятностное предсказание; Вариационные автокодеры; и генерирующие состязательные сети (GAN).

Глава 5: Производство 🔑

Как: оптимизировать R выбор среды размещения; системы перехода к живому использованию; измерять и контролировать точность; разработать надежный процесс обеспечения качества; и внедрить эффективную программу технического обслуживания.

«Неиспользованная система искусственного интеллекта не представляет никакой ценности. Разработайте производственный процесс, который плавно переводит разрабатываемые вами системы искусственного интеллекта для использования в реальных условиях ».

  • Производство ИИ следует обычному процессу разработки и требует от вас проведения исследования, разработки прототипа и создания минимально жизнеспособного продукта (MVP). В процессе производства проведите циклы создания идей, исследований, разработок и обеспечения качества.

  • Для эффективных исследований и разработок требуются быстрые итерации. Первоначально оптимизируйте скорость, а не качество. Предпочтительнее запускать раннюю модель в производство для обратной связи, чем ждать, пока исследовательская модель станет идеальной.

«На этапе исследований и разработок запрашивайте отзывы о прототипах не только от специалистов по ИИ и производства, чтобы свести к минимуму дорогостоящую последующую переработку».

  • При переходе от MVP к производственной выберите подходящую среду хостинга:
  • Локальный хостинг подходит для тех, у кого есть высокочувствительные данные и существующее локальное оборудование, но он редко предпочитается компаниями на начальном этапе из-за высоких первоначальных затрат, непредсказуемых уровней активности и необходимого опыта в области безопасности. Размещение собственного оборудования в центре обработки данных обеспечивает контроль и ценность в долгосрочной перспективе. Однако первоначальные затраты могут быть высокими, а управление центром обработки данных может отвлекать молодые компании.
  • Облачный хостинг, который предлагает низкие первоначальные затраты и высокий уровень гибкости, хорошо подходит для многих компаний на ранней стадии развития, хотя годовые затраты могут быть вдвое больше, чем у самоуправляемого центра обработки данных, а облачный хостинг может быть неподходящим для высокочувствительных данных. Учтите физическое местоположение, в котором размещены ваши облачные серверы. В разных странах действуют разные правила в отношении данных, и от вас может потребоваться хранить свои данные в пределах страны их происхождения.
  • Доказательство эффективности систем искусственного интеллекта отличается от стандартного процесса обеспечения качества программного обеспечения. Тестируйте свою систему искусственного интеллекта на нескольких этапах - во время обучения, проверки и непрерывно в течение всего срока службы. Эффективность имеет решающее значение; максимально автоматизировать тестирование.
  • Поймите три основных критерия «точности» в ИИ - отзывчивость, точность и аккуратность - и отслеживайте все три, чтобы оценить эффективность. Трудно найти баланс между точностью и отзывчивостью. Выбираете ли вы минимизацию ложных срабатываний или ложных срабатываний, это должно зависеть от характера вашего сектора и проблемы, которую вы решаете.
  • Эффективная программа обслуживания поддержит интеллект вашего ИИ. Помимо обслуживания, которое вы обычно выполняете для системы программного обеспечения, вам следует постоянно проверять и обновлять свою систему искусственного интеллекта. Технология искусственного интеллекта развивается быстрыми темпами. Инвестируйте в постоянное улучшение, чтобы ваша система не устаревала.

Глава 6: Правила и этика 👍

Как: соблюдать GDPR; проверять соответствие автоматизированных систем нормативным требованиям; изучить различные подходы к «объяснимости»; и применять принципы этичного использования данных.

  • По мере роста внимания к конфиденциальности данных и в связи с действующим Общим регламентом защиты данных (GDPR) во всем Европейском союзе (ЕС) жизненно важно обеспечить правильное использование данных. GDPR применяется ко всем компаниям, обрабатывающим персональные данные людей в ЕС, независимо от местонахождения компании.
  • Компании, которые являются «контролерами» или «обработчиками» личной информации, несут ответственность за обработку личной информации физических лиц. Продемонстрировать соблюдение требований GDPR в отношении обработки данных и принципов защиты, справедливости и прозрачности. Сведите к минимуму количество требуемых личных данных, чтобы снизить нормативный риск, и псевдонимизируйте все личные данные с помощью анонимизации, шифрования или токенизации.
  • Помимо стандартизации требований к обработке данных и штрафов за неправомерное использование, GDPR ввел соображения, которые могут конкретно повлиять на системы искусственного интеллекта. Убедитесь, что автоматизированные системы соответствуют требованиям GDPR. Статья 22 GDPR запрещает юридические последствия, возникающие исключительно в результате автоматической обработки, осуществляемой без явного согласия физического лица, когда согласие требуется. В настоящее время интерпретации подлежат некоторые законодательные термины. Если вы разрабатываете систему, которая может существенно повлиять на жизнь человека, может быть разумным сделать вашу систему только рекомендательной и включать проверку человеком.
  • «Объяснимость» - объяснение того, как получаются результаты работы вашей системы искусственного интеллекта, - приобретает все большее значение. Конвенция 108 Совета Европы, принятая в законодательстве Великобритании и ЕС в мае 2018 года, предоставляет людям право получить знания о причинах, лежащих в основе применяемых к ним систем обработки данных. Объяснение может быть сложной задачей по отношению к системам глубокого обучения. Изучите различные подходы к объяснимости, включая предполагаемое объяснение, экстраполяцию признаков и анализ ключевых переменных. Каждый предлагает компромиссы относительно сложности, скорости и объяснительной силы.

  • Разработайте структуру этичного использования данных, чтобы избежать репутационных и финансовых затрат. Структура ALGOCARE, разработанная Полицейскими силами Дарема в сотрудничестве с учеными, подчеркивает проблемы, которые следует учитывать при управлении данными. Он включает в себя: характер вывода системы (консультативный); законность сбора данных (законность); понимаете ли вы значение используемых данных (Гранулярность); кому принадлежит IP, связанный с данными (Право собственности); должны ли результаты вашей системы быть доступны для оспаривания людьми (Challenge); как тестируется ваша система (Точность); обсуждены и заявлены ли этические соображения (Ответственные); и была ли ваша модель объяснена доступным образом в максимально возможной степени (Объяснимо).

«Планируйте этичный ИИ с самого начала и поддерживайте все инициативы. Это должно быть основополагающим, а не второстепенным ». Стивен Робертс, Барклай

🤖️ Загрузить Пособие по ИИ.