MiniMax M2.7: когда ИИ начинает эволюционировать сам

Habr AI 23 мар 2026

Команда MiniMax представила M2.7 — первую модель серии, которая участвовала в собственной доработке через RL-петли и агентные сценарии. Результаты: 56.22% на SWE-Pro, 1495 ELO на GDPval-AA, 97% adherence при работе с 40+ сложными навыками.

Введение: от обратной связи к самоэволюции

Модель M2.7 не просто очередная итерация с улучшенными метриками. Это первый эксперимент, в котором модель строила сложные агентные оркестрации, управляла динамическим поиском инструментов, обновляла собственную память и параметры RL-обучения, оптимизировала архитектуру харнесса на основе результатов.

Архитектура самоэволюции: как модель учится улучшать себя

Внутренний workflow MiniMax построен вокруг исследовательского агента, который взаимодействует с разными проектными группами. Система покрывает пайплайны данных, тренировочные окружения, инфраструктуру оценки, кросс-командную коллаборацию, персистентную память.

Программная инженерия: от генерации кода к пониманию продакшена

M2.7 демонстрирует системное мышление: алерт в продакшене, корреляция метрик мониторинга, статанализ трейсов, авто-подключение к БД для верификации, поиск отсутствующего миграционного файла индекса, предложение non-blocking CREATE INDEX для быстрого фикса, формирование MR с объяснением и тестами.

Профессиональные сценарии: офис, финансы, аналитика

На GDPval-AA (45 моделей) M2.7 набрала 1495 ELO — лучший результат среди открытых моделей. Модель также демонстрирует способность к финансовому анализу компании, проектированию assumptions, построению модели прогнозирования выручки, генерации PPT-презентации и Word-отчёта по шаблонам.

Развлечения и интерактив: от продуктивности к персонажам

M2.7 усиливает аспекты эмоционального интеллекта: стабильное удержание роли в длительных диалогах, адаптация стиля под контекст, проактивное взаимодействие с окружением. Команда представила OpenRoom — интерактивную среду, где персонажи «живут» в веб-интерфейсе, а не в текстовом потоке.

Доступность и интеграция

M2.7 уже доступна: MiniMax Agent, API Platform, Coding Plan.

Заключение: что это значит для разработчиков

Самоэволюция — не хайп, а рабочий инструмент. Инженерное мышление > генерация кода. Мульти-агентность становится нативной. Персонажи и интерактив — следующий фронтир.

Читать оригинал

MiniMax M2.7: когда ИИ начинает эволюционировать сам

Введение: от обратной связи к самоэволюции

Архитектура самоэволюции: как модель учится улучшать себя

Программная инженерия: от генерации кода к пониманию продакшена

Профессиональные сценарии: офис, финансы, аналитика

Развлечения и интерактив: от продуктивности к персонажам

Доступность и интеграция

Заключение: что это значит для разработчиков

MiniMax M2.7: когда ИИ начинает эволюционировать сам. Технический разбор новой модели

Введение: от обратной связи к самоэволюции

Архитектура самоэволюции: как модель учится улучшать себя

Исследовательский агент как «ко-пилот» для ML-инженера

Рекурсивная оптимизация харнесса

Эксперимент в low-resource сценариях: M2.7 на MLE Bench Lite

Программная инженерия: от генерации кода к пониманию продакшена

Отладка в реальном времени: кейс production debugging

Бенчмарки: цифры, которые имеют значение

Agent Teams: мульти-агентная коллаборация как нативная фича

Профессиональные сценарии: офис, финансы, аналитика

Два столпа эффективности в office-задачах

Кейс: финансовый анализ компании (на примере TSMC)

Развлечения и интерактив: от продуктивности к персонажам

Почему эмоциональный интеллект важен даже в agent-сценариях

OpenRoom: демо новой парадигмы взаимодействия

Доступность и интеграция

Заключение: что это значит для разработчиков