Что такое HITL и как человеческий опыт повышает эффективность машинного обучения

Что такое HITL

Human-in-the-Loop (или «человек в контуре») — это метод машинного обучения, при котором активно используется человеческий опыт, в частности при настройке и использовании нейросетей. Так, модели быстрее адаптируются к изменяющимся условиям и выдают более точные результаты.

При использовании HITL эксперты оценивают логику рассуждений ИИ, проверяют факты и корректируют возможные ошибки нейросетей. Основная задача метода — объединить вычислительную мощность машины и умение людей понимать контекст, применять критическое мышление.

Как работает цикл обучения

Технически HITL — это замкнутый цикл обратной связи, состоящий из следующих этапов:

Подготовка с учителем. Люди собирают размеченный набор данных, на котором алгоритм учится выявлять закономерности.
Активное обучение. Модель анализирует новые, неразмеченные данные и оценивает свою уверенность в результате. Если она ниже указанного порога, система не принимает решение самостоятельно, а передает кейс человеку для проверки и исправления ошибки. Когда это будет сделано, эксперт возвращает пример в систему.

В итоге нейросеть учится не на всем подряд, а фокусируется на самых сложных случаях, где она чаще всего ошибается. Это повышает экономическую эффективность процесса и качество обработки данных.

Зачем нужен человеческий фактор

Машинное обучение без участия человека приводит к накоплению ошибок и смещению данных. Поэтому вмешательство эксперта требуется:

Для работы с неопределенностью. Информация нередко сопровождается шумом, противоречива или неполна. Специалист может отличить дефект данных от реальной аномалии.
Для соблюдения этики и безопасности. HITL выступает фильтром, где модераторы оценивают ответы модели и штрафуют ее за некорректные выводы. Это создает своеобразные настройки, которые удерживают ИИ в рамках этических норм.

Где применяется HITL

Прикладное значение метода обширно. Вот лишь некоторые сферы применения:

В компьютерном зрении. Здесь человек помогает алгоритму разбираться с нестандартными ситуациями. Например, автопилот в машине может принять рисунок человека на кузове грузовика за настоящего пешехода. При просмотре камер беспилотников эксперты указывают системе на такие нюансы, объясняют разницу между изображением и физическим объектом.

В медицине. ИИ ставит предварительный диагноз по рентгеновскому снимку или МРТ, но финальное решение принимает врач. Если он не согласен с выводами алгоритмов, то такой случай становится обучающим примером.

В финансах. Банковская система блокирует явные атаки, но подозрительные транзакции с нетипичными признаками отправляются на ручную проверку. Впоследствии они помогут обновить базу знаний модели.

**В обработке документов **— для более точного распознавания текста. Особенно это касается рукописных материалов. Здесь человек помогает обеспечить практически стопроцентную точность оцифровки.

Недостатки HITL

Несмотря на эффективность, внедрение человека в контур обучения создает ряд сложностей:

Стоимость и масштабируемость. Во-первых, труд экспертов дорог. Во-вторых, для дообучения модели требуются тысячи часов работы врачей, юристов, геодезистов и других узких профи. Поэтому получается, что скорость обучения модели ограничивается скоростью работы оператора.
Человеческий фактор. Люди устают, совершают ошибки. Если эксперт предоставит неверные данные, то модель запомнит эту ошибку как норму. Частично это решает система перекрестной проверки, когда одно и то же задание проверяют несколько модераторов.
Психологический аспект. Работа по разметке социального контента или аварийных ситуаций может быть травмирующей для морального состояния операторов. Необходимо искать баланс между эффективностью обучения ИИ и ментальным здоровьем сотрудников.