MiniMax M2.7: когда ИИ начинает эволюционировать сам

MiniMax M2.7: когда ИИ начинает эволюционировать сам

Команда MiniMax представила M2.7 — первую модель серии, которая участвовала в собственной доработке через RL-петли и агентные сценарии. Результаты: 56.22% на SWE-Pro, 1495 ELO на GDPval-AA, 97% adherence при работе с 40+ сложными навыками.

Введение: от обратной связи к самоэволюции

Модель M2.7 не просто очередная итерация с улучшенными метриками. Это первый эксперимент, в котором модель строила сложные агентные оркестрации, управляла динамическим поиском инструментов, обновляла собственную память и параметры RL-обучения, оптимизировала архитектуру харнесса на основе результатов.

Архитектура самоэволюции: как модель учится улучшать себя

Внутренний workflow MiniMax построен вокруг исследовательского агента, который взаимодействует с разными проектными группами. Система покрывает пайплайны данных, тренировочные окружения, инфраструктуру оценки, кросс-командную коллаборацию, персистентную память.

Программная инженерия: от генерации кода к пониманию продакшена

M2.7 демонстрирует системное мышление: алерт в продакшене, корреляция метрик мониторинга, статанализ трейсов, авто-подключение к БД для верификации, поиск отсутствующего миграционного файла индекса, предложение non-blocking CREATE INDEX для быстрого фикса, формирование MR с объяснением и тестами.

Профессиональные сценарии: офис, финансы, аналитика

На GDPval-AA (45 моделей) M2.7 набрала 1495 ELO — лучший результат среди открытых моделей. Модель также демонстрирует способность к финансовому анализу компании, проектированию assumptions, построению модели прогнозирования выручки, генерации PPT-презентации и Word-отчёта по шаблонам.

Развлечения и интерактив: от продуктивности к персонажам

M2.7 усиливает аспекты эмоционального интеллекта: стабильное удержание роли в длительных диалогах, адаптация стиля под контекст, проактивное взаимодействие с окружением. Команда представила OpenRoom — интерактивную среду, где персонажи «живут» в веб-интерфейсе, а не в текстовом потоке.

Доступность и интеграция

M2.7 уже доступна: MiniMax Agent, API Platform, Coding Plan.

Заключение: что это значит для разработчиков

Самоэволюция — не хайп, а рабочий инструмент. Инженерное мышление > генерация кода. Мульти-агентность становится нативной. Персонажи и интерактив — следующий фронтир.

Читать оригинал