Как роботы учатся: краткая современная история

MIT Tech Review AI 17 апр 2026

Робототехники раньше мечтали о большом, но строили маленькое. Они хотели повторить или превзойти необыкновенную сложность человеческого тела, а затем тратили свою карьеру на усовершенствование роботизированных рук для автомобильных заводов. Цель - создать робота, похожего на C-3P0, но в итоге получался Roomba.

Настоящая амбиция многих этих исследователей заключалась в создании робота из научной фантастики - робота, который мог бы двигаться в мире, адаптироваться к разным средам и взаимодействовать с людьми безопасно и полезно. Для социально настроенных людей такой робот мог бы помочь людям с проблемами мобильности, облегчить одиночество или выполнять работу, слишком опасную для людей. Для более финансово ориентированных людей это означало бы бесконечный источник бесплатного труда.

Революция в обучении машин

Представьте, что вы хотите установить в своем доме пару роботизированных рук, чтобы они выполняли только одну задачу: складывание одежды. Как они научатся это делать? Вы могли бы начать с написания правил. Проверьте ткань, чтобы определить, какую деформацию она может выдержать, прежде чем разорваться. Определите воротник рубашки. Переместите захват к левому рукаву, поднимите его и сложите внутрь точно на это расстояние. Повторите для правого рукава. Если рубашка повернута, поверните план соответственно. Если рукав скручен, исправьте его. Очень быстро количество правил увеличивается, но полный учет их мог бы дать надежные результаты.

Около 2015 года передовой край начал делать вещи по-другому: создать цифровую симуляцию роботизированных рук и одежды, и дать программе сигнал вознаграждения каждый раз, когда она успешно складывает, и сигнал неудачи каждый раз, когда она терпит неудачу. Таким образом, она становится лучше, пробуя все sorts техники через пробу и ошибку, с миллионами итераций - таким же образом, как ИИ стал хорошим в играх.

ЧатГПТ и новая эра робототехники

Приход ЧатГПТ в 2022 году стал катализатором текущего бума. Обученный на огромных объемах текста, большие языковые модели работают не через пробу и ошибку, а путем обучения предсказывать, какое слово должно быть следующим в предложении. Аналогичные модели, адаптированные для робототехники, вскоре смогли поглощать изображения, показания датчиков и положение суставов робота и предсказывать следующее действие, которое должно выполнить машина, выдавая десятки команд двигателя каждую секунду.

Открытый ИИ и робототехника

Открытый ИИ попытался обучить свою роботизированную руку, Дактил, виртуально - с помощью цифровых моделей руки и кубиков, которые Дактил должен был манипулировать. Кубики имели буквы и цифры на своих гранях; модель могла задать задачу, например, «Поверните кубик так, чтобы красная грань с буквой О смотрела вверх».

Решение называется доменной рандомизацией. Вы по сути создаете миллионы симулированных миров, которые все немного и случайно различаются друг от друга. В каждом из них трение может быть меньше, освещение более суровым, или цвета потемнее. Воздействие на достаточно большое количество этой вариации означает, что роботы будут лучше способны манипулировать кубиком в реальном мире.

Гугл ДипМайнд и робототехника

Около 2022 года команда робототехники Гугла занималась странными вещами. Они потратили 17 месяцев на то, чтобы вручить людям контроллеры роботов и снять их, выполняющих все, от подбора пакетов чипсов до открытия банок. Команда в итоге каталогизировала 700 разных задач.

Целью было построить и протестировать одну из первых крупномасштабных фундаментальных моделей для робототехники. Как и большие языковые модели, идея заключалась в том, чтобы ввести много текста, токенизировать его в формат, с которым мог бы работать алгоритм, и затем сгенерировать вывод. Гугл получил входные данные о том, что робот смотрел, и как были расположены многие части роботизированной руки; затем он принимал инструкцию и переводил ее в команды двигателя, чтобы переместить робота.

Ковариант и робототехника

В 2017 году, до того, как Открытый ИИ закрыл свою первую команду робототехники, группа ее инженеров выделила проект под названием Ковариант, целью которого было построить не научно-фантастических гуманоидов, а самый прагматичный из всех роботов: руку, которая могла бы подбирать и перемещать вещи на складах.

После построения системы на основе фундаментальных моделей, аналогичных моделям Гугла, Ковариант развернул эту платформу на складах, таких как те, которые эксплуатируются компанией Crate & Barrel, и рассматривал ее как конвейер сбора данных.

Аджилити Роботикс и гуманоидные роботы

Новые инвестиционные доллары, текущие в робототехнику, в основном направлены на роботов, имеющих форму не лампы или руки, а человека. Гуманоидные роботы должны быть способны без проблем входить в пространства и выполнять работу, где в настоящее время работают люди, избегая необходимости перестраивать сборочные линии, чтобы приспособить их к новым формам, таким как巨альные руки.

Это легче сказать, чем сделать. В редких случаях, когда гуманоиды появляются в реальных складах, они часто ограничены зонами тестирования и пилотными программами.

Однако гуманоид Digit от Agility, кажется, выполняет некоторую реальную работу. Дизайн - с открытыми суставами и явно нечеловеческой головой - обусловлен более функцией, чем научно-фантастической эстетикой. Amazon, Toyota и GXO (логистический гигант с клиентами, такими как Apple и Nike) все развернули его, сделав его одним из первых примеров гуманоидного робота, который компании рассматривают как источник реальной экономии средств, а не новинку.