OpenAI выпустила GPT-5.5 с акцентом на улучшение возможностей в области программирования

OpenAI выпустила GPT-5.5 с акцентом на улучшение возможностей в области программирования

OpenAI представила GPT-5.5 — значительное обновление, ориентированное на программирование, агентные функции и автономную работу. Модель уже доступна для пользователей тарифных планов Plus, Pro, Business и Enterprise в ChatGPT и Codex. Более мощная версия GPT-5.5 Pro доступна для Pro, Business и Enterprise. Доступ к API пока не открыт, но разработчики могут ожидать его в ближайшее время.

Что нового в GPT-5.5

GPT-5.5 — это первая полностью переобученная базовая модель со времён GPT-4.5. Она предназначена для выполнения сложных задач с минимальным участием пользователя: планирования, использования инструментов, самопроверки и автономного действия.

Модель поддерживает контекстное окно до 1 миллиона токенов в API и до 400 тысяч — в Codex. Это позволяет загружать целые кодовые базы в один промпт, упрощая анализ и разработку.

Доступны две версии:

  • GPT-5.5 — стандартная модель для большинства задач.
  • GPT-5.5 Pro — использует параллельные вычисления для повышения точности в сложных сценариях, таких как технический анализ и научные исследования.

Результаты в бенчмарках

Наибольший рост показан в тестах по программированию и агентной деятельности:

  • Terminal-Bench 2.0: 82,7% (у GPT-5.4 — 75,1%), что делает GPT-5.5 лидером среди публичных моделей.
  • Expert-SWE: 73,1% против 68,5% у предыдущей версии.
  • SWE-Bench Pro: 58,6%. Claude Opus 4.7 превзошёл её с 64,3%, но OpenAI указала на возможное запоминание результатов.

Другие ключевые показатели:

  • GDPval: 84,9% — модель соответствует или превосходит профессионалов в 44 реальных профессиях.
  • FrontierMath, уровень 4: 35,4% (стандарт) и 39,6% (Pro).
  • BrowseComp: 90,1% у Pro — эффективность поиска сложной информации в интернете.
  • OSWorld-Verified: 78,7% — навыки работы с интерфейсами ПК.

GPT-5.5 возглавляет Artificial Analysis Intelligence Index с 60 баллами, опережая Claude Opus 4.7 и Gemini 3.1 Pro (по 57 баллов).

Однако рост в профессиональных задачах (GDPval) по сравнению с GPT-5.4 (83,0%) умеренный. Основные улучшения — в программировании и агентных функциях.

Эффективность и скорость

Несмотря на рост производительности, задержка на токен осталась на уровне GPT-5.4. При этом использование выходных токенов сократилось примерно на 40% при сопоставимых задачах — это повышает эффективность.

В Codex появился режим Fast, который ускоряет генерацию в 1,5 раза при стоимости, в 2,5 раза превышающей стандартную. Он подходит для интерактивных сессий программирования.

Теперь доступно пять уровней обработки — от «без рассуждений» до «xhigh». Это позволяет гибко управлять ресурсами в зависимости от задачи: от быстрых исправлений до глубокой отладки.

Цены и экономика использования

Цены на API выросли вдвое по сравнению с GPT-5.4:

  • Стандартный API: 5 долларов за миллион входных токенов, 30 — за выходные.
  • GPT-5.5 Pro: 30 и 180 долларов соответственно.

Тарифы Batch и Flex — в два раза дешевле стандартных. Приоритетная обработка — в 2,5 раза дороже. Окно в 1 миллион токенов доступно для всех.

OpenAI утверждает, что сокращение выходных токенов компенсирует рост цен. По оценкам Office Chai, чистые затраты выросли примерно на 20%.

Для задач с длинным выводом или большими объёмами контекста переключение может увеличить расходы. Командам рекомендуется провести собственный анализ перед миграцией.

Безопасность и оценка рисков

OpenAI классифицировала GPT-5.5 как модель с «высоким» уровнем способностей в кибербезопасности и биохимии — ниже «критического», но с реальным скачком в наступательных возможностях.

Модель прошла расширенное тестирование «красной командой», включая проверки кибер- и биорисков. Внедрены строгие классификаторы, которые могут показаться раздражающими при первом использовании.

API будет запущен с задержкой, чтобы адаптировать меры безопасности под нужды партнёров. Расширяется программа «Trusted Access for Cyber» — доступ для проверенных специалистов по безопасности.

Релиз вышел на фоне усиления конкуренции в сфере безопасных ИИ: ранее Anthropic представила превью Claude Mythos с акцентом на кибербезопасность.

Технические улучшения

Ключевые изменения «под капотом»:

  1. Первая полностью переобученная базовая модель со времён GPT-4.5.
  2. Обучение и запуск на системах NVIDIA GB200 NVL72.
  3. Полностью переработанная система обработки запросов — обеспечивает высокую скорость при росте сложности.

Теперь Codex поддерживает работу с браузерами: агент может переходить по страницам, делать скриншоты и выполнять веб-задачи автономно.

Улучшен генератор изображений: теперь он способен отображать читаемый текст — важный шаг в преодолении слабого места ИИ-генерации.

Вывод

GPT-5.5 — обновление, в первую очередь важное для разработчиков. Улучшения в программировании, агентных функциях и эффективности использования токенов делают её мощным инструментом для сложных задач.

Для обычных пользователей — написания текстов, резюмирования, писем — прирост менее заметен. Повышение цен делает переход неоднозначным: он оправдан в Codex и технических сценариях, но требует анализа в других.

Это не обновление, которое стоит внедрять немедленно везде. Но для тех, кто работает с кодом и сложными агентами, GPT-5.5 — серьёзный шаг вперёд.

Читать оригинал