Использование токенов в модели Claude: 11% тратится на вежливость и мета-комментарии

Habr AI 13 апр 2026

Было проведено исследование, чтобы определить, сколько токенов модели Claude тратится на вежливость и мета-комментарии. Для этого было проанализировано 500 запросов и ответов модели.

Метод исследования

Были использованы простые регэкспы, чтобы определить «мусорные» токены в ответах модели. Также было проведено ручное разметка первых 50 ответов, чтобы проверить точность регэкспов.

Результаты

Было обнаружено, что 11,3% выходных токенов уходили на вежливость и мета-комментарии. Самый большой кусок «мусора» составляли мета-комментарии про сам процесс.

Оптимизация модели

Была проведена оптимизация модели, чтобы уменьшить количество «мусорных» токенов. Для этого было добавлено три строки в system prompt. После оптимизации количество «мусорных» токенов уменьшилось до 1,8%.

Экономия

Было подсчитано, что экономия от оптимизации модели может составлять около 9,5% выходных токенов. Для сервиса с 2000 запросами в день это может составлять около 4 200 ₽ в месяц.

Вывод

Было сделано заключение, что оптимизация модели может привести к значительной экономии. Однако, необходимо учитывать специфику каждого сервиса и не удалять вежливость и мета-комментарии в живом чате.

Читать оригинал

Использование токенов в модели Claude: 11% тратится на вежливость и мета-комментарии

Метод исследования

Результаты

Оптимизация модели

Экономия

Вывод

Посчитал, сколько токенов Claude тратит на «Конечно!» и «Отлично!». 11% счёта

Простой эксперимент: 500 запросов, один регэксп

Что получилось

Три строки, которые это убрали

Сколько это в деньгах

Что сломалось

Что дальше