Mythos и реальность

Mythos и реальность

Недавно Anthropic заявили, что их модель Mythos чрезвычайно опасна из-за высоких хакерских способностей. Поскольку доступ к модели пока ограничен, проверить это независимо сложно. Однако вокруг заявления разгорелся ажиотаж: в США и Великобритании экстренно собрались совещания банковского сектора, OpenAI представили GPT-5.4-Cyber, а сервис cal.com объявил о переходе из опенсорса в закрытую разработку из-за растущих рисков.

Проверка от государственной организации

Первые независимые оценки способностей Mythos появились. Наиболее авторитетный анализ — от британского AI Security Institute (AISI). Организация получила доступ к модели и провела собственные тесты, избегая крайностей в выводах.

AISI отмечает, что способности ИИ в кибербезопасности растут постепенно уже три года. Mythos продолжает этот тренд: это шаг вперёд, но не революционный скачок.

На лёгких CTF-заданиях модель показывает результаты, сопоставимые с другими передовыми ИИ. Более интересны тесты уровня «эксперт» — год назад модели с ними не справлялись. Mythos решил 73% таких задач, став первой моделью с таким результатом.

Тест «The Last Ones»

Особый интерес вызвал тест «The Last Ones» — симуляция атаки на корпоративную сеть, требующая 32 последовательных шага. Ранее ни одна модель не проходила его полностью. Mythos впервые достиг успеха в 3 из 10 попыток.

Однако в AISI подчёркивают: в реальности атаковать сложнее, так как в тесте не учитываются все возможные системы защиты.

Выводы AISI:

  • Миф: Mythos — сенсационная модель, которая мгновенно меняет кибербезопасность.
  • Реальность: ИИ становится всё способнее, и Mythos лишь акцентирует внимание на этом тренде.

Наиболее уязвимы небольшие и слабо защищённые системы. Владельцам таких систем стоит срочно внедрить известные меры защиты. А в целом — будущие модели будут ещё сильнее, и кибербезопасность нужно пересматривать уже сейчас. При этом ИИ может помочь не только в атаках, но и в поиске, и устранении уязвимостей.

Фактор стоимости: мнение Дрю Брюнига

Техноблогер Дрю Брюнинг проанализировал тест AISI и обратил внимание на важный нюанс: для прохождения «The Last Ones» моделям выделяли до 100 миллионов токенов. Значительная часть прогресса происходила после 50 миллионов — то есть, успех требует огромных ресурсов.

Mythos — не только мощная, но и дорогая модель. Это превращает кибербезопасность в «битву кошельков»: чтобы не быть взломанным, нужно тратить на защиту больше, чем злоумышленники — на атаку.

Брюнинг считает, что это выгодно опенсорсу: популярные проекты, защищаемые крупными компаниями, могут стать более надёжными, чем самописные решения. Также появится новый этап в разработке — «закалка» кода с помощью ИИ, глубина которой будет зависеть от бюджета.

Его вывод:

  • Миф: Теперь любой школьник сможет находить уязвимости в ядре Linux. Даже при открытом доступе к Mythos, не у всех хватит ресурсов его использовать.
  • Реальность: Обнаружение уязвимостей становится доступнее, но пока — только для тех, кто может себе это позволить.

Подход Aisle: дешёвые модели и подзадачи

Компания Aisle исследовала, могут ли небольшие модели решать задачи, аналогичные тем, что выполняет Mythos. В некоторых случаях они формально справились, но с одной оговоркой: им подсказывали, где искать уязвимости. Mythos, по заявлению Anthropic, находит их самостоятельно.

Критики указывают на слабость методологии Aisle, но их другие тезисы важны. Во-первых, кибербезопасность — не единая задача, а набор подзадач, которые можно распределять между разными моделями.

Во-вторых, способности малых моделей неравномерны: они могут отлично справляться с отдельными задачами. Это открывает путь к экономии: зачем платить за дорогую модель, если дешёвая справляется с конкретной подзадачей?

Вывод Aisle:

  • Миф: Все инструменты безопасности нужно срочно заменить на Mythos.
  • Реальность: Mythos — мощный и дорогой инструмент, но для многих задач подойдут и более простые решения.

В заключение

Пока рано делать окончательные выводы. Неясно, какой поток уязвимостей реально сможет генерировать Mythos. Но уже сейчас ясно: крайние позиции — «прорыв» или «ерунда» — неуместны.

Главная ценность не в самой модели, а в тренде: возможности LLM в кибербезопасности растут. В этом году новые модели, вероятно, превзойдут Mythos — и сделают это дешевле, возможно, даже в открытом доступе.

Это может резко обострить ситуацию с уязвимостями, особенно если не устранить уже существующие, но необнаруженные проблемы. Конкретная модель не переворачивает мир — это миф. Но тренд, который она демонстрирует, действительно может всё изменить — это реальность.

Читать оригинал