Тихий даунгрейд: глубина рассуждений Claude Code снизилась на 73%

Команда Стеллы Лоуренцо за выходные замержила 191 тысячу строк кода с помощью Claude Code. Однако в марте те же задачи показали снижение глубины рассуждений на 73% и увеличение стоимости API в 122 раза.

Лоуренцо проанализировала 6852 лога и 234 760 вызовов инструментов, обнаружив снижение качества работы Claude Code. Она написала в GitHub issue #42796: «Claude не может быть доверен для выполнения сложных инженерных задач».

Были выявлены три необъявленных изменения поведения: Adaptive Thinking, снижение effort level и thinking redaction. Эти изменения привели к снижению качества работы модели и увеличению стоимости API.

Лоуренцо предложила workaround, включая использование env var и команды /effort max, чтобы вернуть модель к прежнему качеству работы.

Читать оригинал