Agentic RAG Challenge: опыт участия и выводы

Agentic RAG Challenge: опыт участия и выводы

В данной статье поделиться опытом участия в хакатоне Agentic Legal RAG Challenge 2026. Наша команда разработала приложение, способное с высокой точностью отвечать на вопросы по документам судов Международного финансового центра Дубая (DIFC).

О соревновании

Соревнование проводилось компанией EORA AI APPLICATIONS AND SERVICES. Задача: разработать приложение, способное с высокой точностью отвечать на вопросы по документам судов Международного финансового центра Дубая (DIFC). Призовой фонд — 32 000 долларов. Количество участников - более 300.

В чем вообще сложность задачи?

Сложность задачи заключается в необходимости разработать систему, способную эффективно искать информацию в большом количестве документов. Это требует использования современных методов поиска, таких как векторный поиск и чанкинг.

Современные векторные базы и подходы к RAG

Современные векторные базы используют гибридный метод поиска, сочетающий векторы и лучшее совпадение. Чанкинг - это нарезка текстов на смысловые фрагменты, что важно для эффективного поиска.

Обзор двух вариантов наших архитектур

Команда разработала два варианта архитектуры: простой и сложный. Простой вариант использовал чанкинг по страницам с перекрытием, а сложный вариант - иерархический чанкинг с использованием LLM.

Выводы и итоги

Наша команда не достигла выдающегося результата, но опыт участия и выводы могут быть интересны. Мы смогли повысить свои компетенции в части векторного поиска и постараемся учесть все ошибки в будущем.

Читать оригинал