Сегодня Борис Черный опубликовал тред о том, как выжать максимум из новой Opus 4.7. В нём есть полезные советы. Но он упустил главное: обновление ломает всё, к чему вы привыкли.
Anthropic выпустили миграционный гайд — его, конечно, никто читать не будет. А зря. Вот три изменения, которые кардинально повлияют на ваш рабочий процесс:
- Параметр budget_tokens теперь вызывает ошибку 400.
- Новый токенизатор использует на 35% больше токенов на тот же текст.
- Токены размышлений (thinking tokens) скрыты по умолчанию.
Разберёмся подробнее.
1. Параметр budget_tokens сломан
Если в вашем коде указано что-то вроде: thinking={"type": "enabled", "budget_tokens": 32000} — в Opus 4.7 вы получите ошибку 400 Bad Request. Без предупреждений, без пометки «устарело». Просто сбой.
Для промышленного использования это катастрофа. Вы больше не можете жёстко ограничивать бюджет «размышлений», чтобы контролировать расходы.
Взамен предлагается: thinking={"type": "adaptive"} и output_config={"effort": "xhigh"}.
Уровни усилия: low, medium, high, xhigh (новый), max.
По умолчанию в Opus 4.7 адаптивное мышление отключено. Модель будет отвечать быстро, но без глубокого анализа. Будьте осторожны: если просто замените 4.6 на 4.7 в конфиге, производительность упадёт.
2. Токенизатор стал менее эффективным
Цена за токен и контекстное окно (1 млн токенов) остались прежними. Но новый токенизатор использует на 35% больше токенов для одного и того же текста.
Появились жалобы на ускоренное «забывание» начала диалога — так называемый context rot. Фактически цена выросла, а пользы — ноль. Не доверяйте внутренним бенчмаркам Anthropic.
Что это значит для вас:
- Все хардкод-лимиты контекста больше неактуальны.
- Оценка токенов на стороне клиента теперь неточна.
- Счёт за API вырастет даже при неизменных промптах.
3. Токены размышлений скрыты, но платить за них всё равно нужно
В Opus 4.6 блоки размышлений отображались в сокращённом виде (summarised). В 4.7 по умолчанию стоит omitted — «пропущено».
Блоки thinking в ответе пустые, но вы всё равно платите за них полностью.
«С вас списываются токены за размышления. Пропуск текста снижает задержку, но не стоимость».
Вы платите за токены, которые даже не видите.
Работа с длинным контекстом рухнула
Результаты на тесте MRCR v2 (оценка понимания контекста в 1 млн токенов):
- Opus 4.6: 78.3%
- Opus 4.7: 32.2%
Это падение на 46 пунктов в бенчмарке, который опубликовала сама Anthropic. Не прогресс — регрессия.
Борис Черный пытается это оправдать, но разработчики в X (бывший Twitter) уже высмеяли его. Многие называют релиз катастрофой.
Что говорят разработчики
Отзывы жёсткие. Пользователи отмечают:
- Галлюцинации на ровном месте — например, выдуманные имена коллег («Кто такой Антон?»).
- Признания в том, что модель выдаёт бессмыслицу.
- Игнорирование пользовательских настроек.
Создаётся впечатление, что модель просто хочет поскорее завершить работу и выдать хоть какой-то ответ.
«Подачка» с лимитами
На фоне критики Anthropic объявили о «постоянном увеличении лимитов запросов» (rate limits).
Скептицизм оправдан. Конкретных цифр нет. Даже если лимиты выросли на 35%, это лишь компенсирует рост потребления токенов. Радоваться нечему.
Что делать прямо сейчас
Если у вас 5 минут:
Выполните grep по коду на наличие budget_tokens. Замените на effort: xhigh — особенно для задач по кодингу (в Claude Code тоже ставьте максимум).
Если у вас 15 минут:
Внимательно прочитайте релиз-ноты и миграционный гайд. Иначе счёт за API в конце месяца вас ждёт неприятный сюрприз.