Создание русскоязычного датасета олимпиадной математики для развития математического ИИ

Создание русскоязычного датасета олимпиадной математики для развития математического ИИ

Математические исследования всё чаще используют методы ИИ для анализа сложных задач, генерации решений и предоставления персонализированного обучения. Однако эффективность таких моделей напрямую зависит от качества и структуры данных, на которых они обучаются.

Команда специалистов создала русскоязычный датасет задач American Invitational Mathematics Examination (AIME) для тренировки логических и алгоритмических способностей языковых моделей.

Датасет можно использовать для бенчмаркинга моделей, обучения и файнтюнинга, а также для создания образовательных инструментов.

В результате работы скрипта был создан датасет, где каждая запись содержит всю информацию о задаче: год проведения, тип контеста, текст условия, текст решения, конечный ответ и ссылку на источник.

Датасет был переведен на русский язык с помощью модели DeepSeek Reasoner и был адаптирован для использования в качестве бенчмарка для оценки языковых моделей.

Модель DeepSeek-Reasoner успешно справилась с ~70% задач из тестового набора, продемонстрировав способность к сложным многошаговым рассуждениям и пониманию математического контекста на русском языке.

Читать оригинал