10 триллионов параметров и статус «слишком опасна»: что мы знаем о Claude Mythos

Habr AI 1 апр 2026

Claude Mythos — новая сверхмощная модель от Anthropic, которую компания пока не планирует выпускать в публичный доступ. Утечка внутренних документов и черновиков блога раскрыла подробности о системе, которую сама Anthropic называет «безусловно самой мощной ИИ-моделью, которую мы когда-либо разрабатывали».

Информация попала в сеть после того, как два исследователя по кибербезопасности обнаружили в открытом кэше почти 3000 неопубликованных материалов компании. Среди них — черновики постов, технические описания и упоминания новой модели. Anthropic подтвердила утечку и назвала Claude Mythos «качественным скачком» в производительности.

Компания уже предоставила ранний доступ к модели некоторым клиентам, в первую очередь — специалистам по кибербезопасности.

Что такое Claude Mythos?

Anthropic предлагает три основные модели: Haiku, Sonnet и Opus. Opus — самая мощная из доступных. Claude Mythos превосходит её и позиционируется как новая вершина в линейке.

Утечённые материалы упоминают также название Capybara — по всей видимости, это классификация уровня модели, а не отдельная система. Mythos и Capybara, вероятно, относятся к одной и той же базовой архитектуре.

По сравнению с Claude Opus 4.6, новая модель демонстрирует значительный рост в трёх ключевых областях:

Кодирование — превосходит Opus на бенчмарках разработки ПО
Академическое рассуждение — более глубокий анализ и решение сложных задач
Кибербезопасность — резкий скачок в способности находить и использовать уязвимости

Оцениваемое количество параметров модели — 10 триллионов. Это объясняет высокую стоимость эксплуатации и решение Anthropic не выпускать её публично.

На сайте m1astra-mythos.pages.dev появились упоминания версий v1 Mythos и v2 Capybara, что указывает на многоэтапную стратегию развёртывания.

Проблема ИИ в кибербезопасности

Внутренние документы Anthropic утверждают, что Claude Mythos «далеко впереди любой другой ИИ-модели по киберспособностям». Это вызывает серьёзные опасения: следующее поколение моделей может находить уязвимости быстрее, чем их успевают закрывать защитники.

Ранее Anthropic зафиксировала инцидент, в котором группа, связанная с китайским государством, использовала Claude Code для атак на 30 организаций — включая технологические компании, банки и госучреждения. Атака была остановлена только после обнаружения активности.

Mythos, по утверждениям, превосходит ту самую модель. Именно поэтому Anthropic изменила подход к её внедрению:

Ранний доступ получают только специалисты по кибербезопасности — чтобы укрепить защиту до возможного злоупотребления
Модель признана слишком дорогой и рискованной для массового релиза
Проводится расширенное тестирование на безопасность, выходящее за рамки стандартных процедур

Ранее OpenAI столкнулась с аналогичной ситуацией: модель GPT-5.3-Codex стала первой, классифицированной как «высокая способность» в области кибербезопасности в рамках её Preparedness Framework. На той же неделе Opus 4.6 от Anthropic показала способность находить неизвестные уязвимости в рабочем коде.

Для разработчиков это тревожный сигнал: будущие ИИ-модели будут представлять серьёзную угрозу для кодовых баз, если безопасность не станет приоритетом.

Заключительные мысли

Claude Opus 4.6 уже изменила подход к программированию и решению сложных задач. Claude Mythos поднимает планку ещё выше — но вряд ли станет доступной для большинства разработчиков в ближайшее время.

Anthropic не объявила дату публичного релиза. Однако подтверждено: модель существует, и её тестирование уже идёт. Главный вывод из утечки — кибербезопасность больше нельзя откладывать на потом.

Читать оригинал