Ключевая идея BrainBody — разделить «мышление» робота на две роли, когда мозг планирует, а тело выполняет. В системе работают две крупные языковые модели. Brain LLM отвечает за общий замысел. Получает задачу высокого уровня и раскладывает ее на отдельные шаги. Как, например, действует человек, заранее планируя маршрут и последовательность действий.

Далее языковая модель Body LLM превращает каждый шаг плана в конкретные команды для моторов и сенсоров в режиме замкнутой обратной связи. С помощью датчиков, камер и микрофонов оценивает обстановку, замечает ошибки и корректирует действия по ходу выполнения. Если что-то невозможно выполнить прямо сейчас, Body LLM сообщает об этом системе, например, «такой команды не хватает» или «нужен другой ход».
После внедрения алгоритма в экспериментальных роботов выполнение бытовых операций, таких как открытие дверей или перемещение предметов, ускорилось примерно на 17 %. Роботы стали реже ошибаться и теряться в нештатных ситуациях.
Такие алгоритмы делают взаимодействие роботов с людьми более точным, безопасным и предсказуемым. Это практичный способ научить машины планировать, двигаться аккуратно и адаптироваться к изменяющимся условиям.
