Представьте, что вы не просто просматриваете улицу в Стритвью (Street View), а попадаете в интерактивную симуляцию реального места — с возможностью менять погоду, время суток или даже представить, как будет выглядеть ваш квартал в условиях апокалипсиса в стиле фильма «Послезавтра».
Такой сценарий становится ближе к реальности благодаря новой интеграции от Google. В ходе конференции Google I/O компания анонсировала подключение Стритвью к Джини (Genie) — своей универсальной модели мира, способной генерировать разнообразные и интерактивные среды.
Симуляция для роботов и людей
«Это мощный инструмент как для робототехники, так и для обычных пользователей, — говорит Джек Паркер-Холдер (Jack Parker-Holder), научный сотрудник команды открытой эволюции в DeepMind. — Именно это и было изначальной идеей проекта Genie».
Он приводит пример: робот, впервые попавший в Лондон, может быть не готов к редким солнечным дням. С помощью Genie можно смоделировать, как солнечные блики отражаются от викторианских домов, чтобы робот не «сбился с толку» при реальном столкновении с таким явлением.
«А вы, возможно, думаете: „Я поеду в Нью-Йорк, но не сейчас. Там будет снег. Хочу посмотреть, как мой квартал выглядит под снегом“».
Огромная база данных
Google собирает данные Стритвью уже 20 лет — с помощью автомобилей с камерами и людей с рюкзаками-рекордерами. За это время компания накопила более 280 миллиардов изображений из 110 стран и семи континентов.
«У нас есть изображения огромной части мира, — говорит Джек. — Представьте, насколько мощным может быть сочетание этих реальных данных с возможностью симуляции целых миров».
Genie 3 и практическое применение
В августе прошлого года Google представила Джини 3 (Genie 3) для исследовательского ознакомления, а в январе открыла доступ к ней подписчикам Google AI Ultra в США. Пользователи могут создавать интерактивные игровые миры по текстовым запросам или изображениям.
Цель — использовать модель в образовании, играх и обучении роботов. Уже сейчас Джини 3 помогает одной из симуляций Waymo тренировать беспилотные автомобили на «крайне редких событиях» — например, торнадо или появлении слонов на дороге.
Раньше симуляции Waymo строились исключительно с точки зрения автомобиля. Джини же позволяет менять перспективу — например, смоделировать улицу с точки зрения пешехода или робота.
Доступ и ограничения
Сегодня доступ к Стритвью в Джини открывается части пользователей Google AI Ultra в США. В ближайшие недели функция появится у всех подписчиков по всему миру.
По словам Дьего Риваса (Diego Rivas), менеджера продукта в DeepMind, цель — дать новую технологию в руки как можно большему числу людей. Но он подчёркивает: и Стритвью в Джини, и сама модель — пока эксперимент. Точность и качество ещё предстоит улучшать.
В демонстрационных примерах — включая симуляцию подводного мира в районе, где я раньше жил — сцены узнаваемы, но выглядят как кадры из видеоигры, а не фотореалистичные изображения.
Модели пока не понимают физику: в одной из симуляций женщина бежит по снежной пустыне Джошуа-Три и проходит сквозь кактусы и кусты.
Физика и пространственное мышление
Сравните это с другими ИИ-инструментами Google: генератором изображений Nano Banana, который идеально пишет текст в инфографике, или видео-генератором Veo, который понимает, что бумажные лодки плывут по течению, дым рассеивается, а ткань облегает формы.
Физика в этих моделях не заложена жёстко — они усваивают её интуитивно, как живые существа, через пассивное наблюдение.
«Я думаю, что в плане точности и качества такие модели отстают от видео на шесть–двенадцать месяцев, — говорит Паркер-Холдер. — Но это вопрос времени — мы это решим».
Джонатан Герберт (Jonathan Herbert), директор по Google Maps, который 12 лет назад начинал в команде Стритвью стажёром, отмечает: пока Джини не может точно воссоздать улицу. Но настоящий прорыв — в пространственной непрерывности.
«Повернитесь на 360 градусов — и ИИ корректно запоминает и воссоздаёт то, что у вас за спиной, — поясняет он. — С этого момента модель может строить на этом новую среду».
«Мы давно думаем, как создать самую полную и богатую модель мира на основе данных Стритвью, — добавляет Герберт. — Использовать данные Maps по-новому — давняя мечта нашей команды».