Исследователи из Google DeepMind представили новую модель искусственного интеллекта, способную предсказывать объекты и сцены, которые находятся за пределами прямой видимости. Эта технология позволяет системе «догадываться» о том, чего она не может наблюдать напрямую, используя контекст и пространственные закономерности.
Как это работает
Модель анализирует видимую часть сцены и строит внутреннее представление о том, что может находиться за её пределами. В основе подхода — использование глубокого обучения (deep learning) и продвинутых методов нейронных сетей, которые обучаются на огромных наборах визуальных данных.
В отличие от традиционных систем машинного зрения, которые ограничиваются тем, что попадает в кадр, новый ИИ способен воссоздавать скрытые элементы — например, форму объекта, который частично закрыт, или продолжение интерьера комнаты за углом.
Применение и перспективы
Такие возможности могут быть полезны в робототехнике, дополненной реальности (AR) и автономных транспортных средствах. Например, автомобиль на основе этой технологии сможет предугадывать появление пешехода из-за здания или паркованного автобуса.
Работа вызвала интерес в научном сообществе и была представлена в подробном документе, подготовленном командой исследователей. Подход демонстрирует, как искусственный интеллект всё ближе подходит к способности понимать мир так, как это делает человек — не только по тому, что видит, но и по тому, что может быть.