Фрилансеры, которые учат человекоподобных роботов дома

Когда Зевс, студент-медик из центральной части Нигерии, возвращается в свою маленькую квартиру после долгого дежурства в больнице, он включает кольцевой свет, закрепляет iPhone на лбу и начинает снимать себя. Он медленно поднимает руки, словно сомнамбула, и застилает кровать. Движения — плавные, осторожные: важно, чтобы руки не выходили за кадр.

Зевс работает сборщиком данных для компании Майкроуан (Micro1) из Пало-Альто, штат Калифорния. Она собирает реальные видео с повседневными действиями и продаёт их робототехническим фирмам. Пока Tesla, Figure AI и Agility Robotics гонятся за созданием человекоподобных роботов — машин, способных действовать в домах и на фабриках, — ролики, записанные фрилансерами вроде Зевса, становятся главным топливом для их обучения.

Майкроуан наняла тысячи подрядчиков более чем в 50 странах — в Индии, Нигерии, Аргентине. Молодые, технически подкованные люди ищут работу, а компания предлагает хорошие деньги по местным меркам. Это поднимает местную экономику, но порождает вопросы о приватности и информированном согласии. А ещё — работа бывает странной.

Зевс узнал о вакансии в ноябре, когда о ней заговорили в LinkedIn и на YouTube. «Это шанс оставить след, внести данные, которые будут использованы для обучения роботов будущего», — подумал он.

Он получает 15 долларов в час — неплохие деньги в Нигерии, где высокая безработица. Но студент, мечтающий стать врачом, считает, что гладить одежду часами — скучно.

«Честно говоря, мне это не очень нравится, — признаётся он. — Я человек, которому нужна техническая задача, где надо думать».

Зевс и все собеседники MIT Technology Review попросили использовать псевдонимы: они не уполномочены говорить о своей работе.

Как учат роботов

Человекоподобных роботов сложно создавать: манипуляции с объектами — непростой навык. Но появление больших языковых моделей, лежащих в основе ЧатГПТ (ChatGPT), изменило подход. Если языковые модели учатся на текстах из интернета, то и роботы могут учиться на огромных массивах данных о движениях.

Однако робототехнике нужны гораздо более сложные данные. Виртуальные симуляции позволяют роботам выполнять акробатические трюки, но не научат брать чашку или протирать стол. Физику в симуляциях воссоздать идеально не удаётся. Поэтому для реальной работы в домах и на заводах нужны данные из реального мира — даже если собирать их долго и дорого.

Инвесторы вкладывают миллиарды, чтобы решить эту задачу. Только в 2025 году в человекоподобных роботов вложили более 6 миллиардов долларов. Сбор данных дома превращается в глобальную фриланс-индустрию.

Компании вроде Scale AI и Encord набирают армии записывающих. DoorDash платит курьерам за съёмку домашних дел. В Китае работники в государственных центрах в очках виртуальной реальности и экзоскелетах учат роботов открывать микроволновку и мыть стол.

«Спрос огромен, и он растёт очень быстро».

Али Ансари, гендиректор Майкроуан (Micro1)

Изо дня в день

Работников в Майкроуан проверяет ИИ по имени Зара: она проводит собеседования и оценивает образцы видео. Каждую неделю фрилансеры присылают ролики, где выполняют домашние дела — по чётким правилам: руки в кадре, движения естественные. Видео проверяют ИИ и люди. Принятые материалы размечают: сотни сотрудников и алгоритмы помечают, какие действия происходят в кадре.

Поскольку метод ещё новый, неясно, что именно делает данные хорошими. Но, по словам Ансари, «нужно много вариаций, чтобы робот мог обобщать действия — навигацию и манипуляции в мире».

Многие работники жалуются: в тесных квартирах сложно придумать разнообразные задания. Зевс, живущий в студии, каждый день гладит одежду — больше нечего снимать. Арджун, репетитор из Дели, тратит час на 15-минутное видео: придумывает, что бы ещё сделать.

«Сколько контента можно создать дома? Сколько?» — спрашивает он.

Приватность и неопределённость

Майкроуан запрещает показывать лицо и личные данные — имена, телефоны, даты рождения. ИИ и модераторы удаляют всё, что просочилось. Но даже без лиц видео передают интимную картину жизни: интерьеры, вещи, ритуалы. Что именно попадает в кадр, работники не всегда понимают.

Для семей — постоянная борьба. Арджун, отец двух дочерей, вынужден уводить двухлетнюю малышку из кадра. «Иногда работать невозможно — дочь маленькая», — говорит он.

Саша, бывший банкир из Нигерии, крадётся по общему двору, развешивая бельё, чтобы не заснять соседей. Те смотрят на неё с недоумением.

Работники знают, что их данные идут на обучение роботов. Но никто не знает, как именно их используют, хранят и передают третьим лицам — включая клиентов Майкроуан. По словам Ансари, из-за конфиденциальности компания не называет заказчиков и не раскрывает детали проектов.

«Важно, чтобы работники понимали, с какой целью собираются данные, — говорит Ясмин Коттури, профессор гуманитарных вычислений в Университете Мэриленда. — И как это может повлиять на них в будущем».

Иногда сотрудники спрашивают в корпоративном Slack, можно ли удалить их данные. Майкроуан отказалась комментировать, делают ли они это.

«Люди сами выбирают эту работу, — говорит Ансари. — Они могут прекратить в любой момент».

Сколько данных нужно?

Некоторые робототехники сомневаются: достаточно ли надёжны данные, собранные в разных домах разными людьми?

«То, как мы живём дома, не всегда безопасно, — говорит Аарон Пратер из ASTM International. — Если роботы усвоят такие привычки, это может привести к авариям».

Компания отсеивает опасные действия, но, по словам Ансари, даже неуклюжие движения полезны — они показывают, как роботу не надо делать.

Майкроуан заявляет, что у неё десятки тысяч часов видео. Scale AI сообщила о более чем 100 000 часах.

«Это займёт больше времени, чем думают люди».

Кен Голдберг, Университет Калифорнии в Беркли

Кен Голдберг, робототехник из Беркли, напоминает: большие языковые модели учились на текстах, которые человеку потребовалось бы 100 000 лет читать. А роботам может понадобиться ещё больше данных — управление суставами сложнее, чем генерация текста.

Когда Датту, студент-инженер из индийского техногородка, приходит домой после учёбы, он пропускает ужин и бежит на балкон, заставленный цветами и гантелями. Закрепляет телефон на лбу и снова и снова складывает одну и ту же одежду.

Родные смотрят на него с подозрением. «Для них это как космические технологии», — говорит он. Друзьям он рассказывает — и те в шоке: «Оплачиваешь домашнюю работу? Невероятно».

Учёба, съёмка, ещё и другие фриланс-задачи — сил не остаётся. Но, говорит Датту, «ощущение, что ты делаешь что-то, чего больше никто не делает».

Читать оригинал