Первый день конференции Data Fusion 2026: роботы, HiRAG и атмосфера науки

Первый день конференции Data Fusion 2026: роботы, HiRAG и атмосфера науки

8 апреля стартовала конференция по искусственному интеллекту Data Fusion 2026 в кластере Ломоносов. Мероприятие, организованное ВТБ, уже несколько лет проходит в формате популяризации ключевых идей в области ИИ и машинного обучения.

Структура и атмосфера

Регистрация строго по предварительной записи — без неё на первый день не попасть. Конференция начинается с утра, а вечерние активности в этот раз отсутствовали. Это немного выбило из ритма: ближе к 16:00, когда появилась бодрость, уже нужно было включаться в общение с коллегами и погружаться в доклады.

Заметна определённая стилистика: фиолетово-сиреневая подсветка, напоминающая оформление мероприятия Яндекса по JVM. В целом, атмосфера научно-деловая, но с элементами выставки.

Научная часть и доклады

В этом году мы выбрали открытый зал с научно-ориентированными докладами, отдав приоритет науке, а не политическим дискуссиям об ИИ. Звучали привычные термины: LLM, RAG, свёрточные нейросети, контекст и память моделей. Однако появилось и новое — например, HiRAG.

Особое внимание привлёк доклад о HiRAG для сервиса VK Video. Система вдохновлена человеческим мышлением: знания организованы иерархически — от деталей к обобщениям. Архитектура включает два модуля: HiIndex и HiRetrieval.

HiIndex строит многоуровневый граф знаний. С помощью гауссовой смеси (GMM) кластеризуются семантически близкие сущности, а LLM генерирует обобщающие понятия. Например, «Big Data» и «Рекомендательные системы» могут быть объединены через абстракцию «Data Mining». Это позволяет видеть не только прямые совпадения, но и логические связи.

Такие подходы — признак перехода от пассивных фильтров к активным рекомендательным агентам, способным помогать пользователям формулировать цели и управлять вниманием.

Роботы и живое общение

Одним из визуальных хитов стали роботы. Они танцевали, делали сальто и пожимали руки. Управлялись они вручную — в целях безопасности. Это напомнило челлендж Промобота, но на этот раз на базе китайского «железа».

Российские разработчики запускают аналогичные конкурсы, показывая, что аппаратная часть уже есть, но для реального внедрения не хватает качественного софта.

Личное впечатление: роботы сопровождали участников, создавая ощущение будущего. Иногда казалось, что ты — единственный настоящий человек среди механических существ.

Коммуникации и нетворкинг

Несмотря на насыщенную программу, установить глубокие контакты сложно. Участники, особенно представители научного сообщества, ведут себя сдержанно. Обменяться парой фраз — возможно, но получить контакты — редкость. По ощущениям, это может быть воспринято как навязчивость.

Формат и польза конференции

Для новичков Data Fusion — отличный способ погрузиться в тему. Для опытных специалистов — скорее возможность освежить знания и «поймать» новые термины: Qwen, OpenMetaData, AI Data Steward и другие.

Доклады часто носят популяризаторский характер. Если вы уже работали с RAG или побеждали на хакатонах, можно частично «выключиться». Однако новые формулировки и подходы всё равно проскальзывают на слайдах.

Английский язык активно используется — были доклады от корейских коллег, а также упоминалось, что в Высшей школе экономики с 2024 года занятия по некоторым курсам ведутся на английском.

Итоги первого дня

Первый день прошёл продуктивно. Конференция остаётся на высоком уровне. Наука, роботы, новые термины — всё на месте. Остаётся посмотреть, чем удивит второй день.

Читать оригинал