1. Главная
  2. Что такое HITL и как человеческий опыт повышает эффективность машинного обучения

Что такое HITL и как человеческий опыт повышает эффективность машинного обучения

2 января 20263 минуты чтения
Иллюстрация материала

Многие полагают, что искусственный интеллект может обучаться самостоятельно. Но за появлением большинства моделей стоит непрерывная работа людей, которые направляют, корректируют и переобучают алгоритмы. Рассказываем, как человек и машина компенсируют недостатки друг друга и зачем это нужно.

Что такое HITL

Human-in-the-Loop (или «человек в контуре») — это метод машинного обучения, при котором активно используется человеческий опыт, в частности при настройке и использовании нейросетей. Так, модели быстрее адаптируются к изменяющимся условиям и выдают более точные результаты.

При использовании HITL эксперты оценивают логику рассуждений ИИ, проверяют факты и корректируют возможные ошибки нейросетей. Основная задача метода — объединить вычислительную мощность машины и умение людей понимать контекст, применять критическое мышление.

Как работает цикл обучения

Технически HITL — это замкнутый цикл обратной связи, состоящий из следующих этапов:

  1. Подготовка с учителем. Люди собирают размеченный набор данных, на котором алгоритм учится выявлять закономерности.
  2. Активное обучение. Модель анализирует новые, неразмеченные данные и оценивает свою уверенность в результате. Если она ниже указанного порога, система не принимает решение самостоятельно, а передает кейс человеку для проверки и исправления ошибки. Когда это будет сделано, эксперт возвращает пример в систему.

В итоге нейросеть учится не на всем подряд, а фокусируется на самых сложных случаях, где она чаще всего ошибается. Это повышает экономическую эффективность процесса и качество обработки данных.

Зачем нужен человеческий фактор

Машинное обучение без участия человека приводит к накоплению ошибок и смещению данных. Поэтому вмешательство эксперта требуется:

  • Для работы с неопределенностью. Информация нередко сопровождается шумом, противоречива или неполна. Специалист может отличить дефект данных от реальной аномалии.
  • Для соблюдения этики и безопасности. HITL выступает фильтром, где модераторы оценивают ответы модели и штрафуют ее за некорректные выводы. Это создает своеобразные настройки, которые удерживают ИИ в рамках этических норм.

Где применяется HITL

Прикладное значение метода обширно. Вот лишь некоторые сферы применения:

В компьютерном зрении. Здесь человек помогает алгоритму разбираться с нестандартными ситуациями. Например, автопилот в машине может принять рисунок человека на кузове грузовика за настоящего пешехода. При просмотре камер беспилотников эксперты указывают системе на такие нюансы, объясняют разницу между изображением и физическим объектом.

В медицине. ИИ ставит предварительный диагноз по рентгеновскому снимку или МРТ, но финальное решение принимает врач. Если он не согласен с выводами алгоритмов, то такой случай становится обучающим примером.

В финансах. Банковская система блокирует явные атаки, но подозрительные транзакции с нетипичными признаками отправляются на ручную проверку. Впоследствии они помогут обновить базу знаний модели.

**В обработке документов **— для более точного распознавания текста. Особенно это касается рукописных материалов. Здесь человек помогает обеспечить практически стопроцентную точность оцифровки.

Недостатки HITL

Несмотря на эффективность, внедрение человека в контур обучения создает ряд сложностей:

  • Стоимость и масштабируемость. Во-первых, труд экспертов дорог. Во-вторых, для дообучения модели требуются тысячи часов работы врачей, юристов, геодезистов и других узких профи. Поэтому получается, что скорость обучения модели ограничивается скоростью работы оператора.
  • Человеческий фактор. Люди устают, совершают ошибки. Если эксперт предоставит неверные данные, то модель запомнит эту ошибку как норму. Частично это решает система перекрестной проверки, когда одно и то же задание проверяют несколько модераторов.
  • Психологический аспект. Работа по разметке социального контента или аварийных ситуаций может быть травмирующей для морального состояния операторов. Необходимо искать баланс между эффективностью обучения ИИ и ментальным здоровьем сотрудников.
Текст: