Google подключила Street View к своей модели мира Genie

Представьте, что вы не просто просматриваете улицу в Стритвью (Street View), а попадаете в интерактивную симуляцию реального места — с возможностью менять погоду, время суток или даже представить, как будет выглядеть ваш квартал в условиях апокалипсиса в стиле фильма «Послезавтра».

Такой сценарий становится ближе к реальности благодаря новой интеграции от Google. В ходе конференции Google I/O компания анонсировала подключение Стритвью к Джини (Genie) — своей универсальной модели мира, способной генерировать разнообразные и интерактивные среды.

Симуляция для роботов и людей

«Это мощный инструмент как для робототехники, так и для обычных пользователей, — говорит Джек Паркер-Холдер (Jack Parker-Holder), научный сотрудник команды открытой эволюции в DeepMind. — Именно это и было изначальной идеей проекта Genie».

Он приводит пример: робот, впервые попавший в Лондон, может быть не готов к редким солнечным дням. С помощью Genie можно смоделировать, как солнечные блики отражаются от викторианских домов, чтобы робот не «сбился с толку» при реальном столкновении с таким явлением.

«А вы, возможно, думаете: „Я поеду в Нью-Йорк, но не сейчас. Там будет снег. Хочу посмотреть, как мой квартал выглядит под снегом“».

Огромная база данных

Google собирает данные Стритвью уже 20 лет — с помощью автомобилей с камерами и людей с рюкзаками-рекордерами. За это время компания накопила более 280 миллиардов изображений из 110 стран и семи континентов.

«У нас есть изображения огромной части мира, — говорит Джек. — Представьте, насколько мощным может быть сочетание этих реальных данных с возможностью симуляции целых миров».

Genie 3 и практическое применение

В августе прошлого года Google представила Джини 3 (Genie 3) для исследовательского ознакомления, а в январе открыла доступ к ней подписчикам Google AI Ultra в США. Пользователи могут создавать интерактивные игровые миры по текстовым запросам или изображениям.

Цель — использовать модель в образовании, играх и обучении роботов. Уже сейчас Джини 3 помогает одной из симуляций Waymo тренировать беспилотные автомобили на «крайне редких событиях» — например, торнадо или появлении слонов на дороге.

Раньше симуляции Waymo строились исключительно с точки зрения автомобиля. Джини же позволяет менять перспективу — например, смоделировать улицу с точки зрения пешехода или робота.

Доступ и ограничения

Сегодня доступ к Стритвью в Джини открывается части пользователей Google AI Ultra в США. В ближайшие недели функция появится у всех подписчиков по всему миру.

По словам Дьего Риваса (Diego Rivas), менеджера продукта в DeepMind, цель — дать новую технологию в руки как можно большему числу людей. Но он подчёркивает: и Стритвью в Джини, и сама модель — пока эксперимент. Точность и качество ещё предстоит улучшать.

В демонстрационных примерах — включая симуляцию подводного мира в районе, где я раньше жил — сцены узнаваемы, но выглядят как кадры из видеоигры, а не фотореалистичные изображения.

Модели пока не понимают физику: в одной из симуляций женщина бежит по снежной пустыне Джошуа-Три и проходит сквозь кактусы и кусты.

Физика и пространственное мышление

Сравните это с другими ИИ-инструментами Google: генератором изображений Nano Banana, который идеально пишет текст в инфографике, или видео-генератором Veo, который понимает, что бумажные лодки плывут по течению, дым рассеивается, а ткань облегает формы.

Физика в этих моделях не заложена жёстко — они усваивают её интуитивно, как живые существа, через пассивное наблюдение.

«Я думаю, что в плане точности и качества такие модели отстают от видео на шесть–двенадцать месяцев, — говорит Паркер-Холдер. — Но это вопрос времени — мы это решим».

Джонатан Герберт (Jonathan Herbert), директор по Google Maps, который 12 лет назад начинал в команде Стритвью стажёром, отмечает: пока Джини не может точно воссоздать улицу. Но настоящий прорыв — в пространственной непрерывности.

«Повернитесь на 360 градусов — и ИИ корректно запоминает и воссоздаёт то, что у вас за спиной, — поясняет он. — С этого момента модель может строить на этом новую среду».

«Мы давно думаем, как создать самую полную и богатую модель мира на основе данных Стритвью, — добавляет Герберт. — Использовать данные Maps по-новому — давняя мечта нашей команды».

Читать оригинал