Использование токенов в модели Claude: 11% тратится на вежливость и мета-комментарии

Использование токенов в модели Claude: 11% тратится на вежливость и мета-комментарии

Было проведено исследование, чтобы определить, сколько токенов модели Claude тратится на вежливость и мета-комментарии. Для этого было проанализировано 500 запросов и ответов модели.

Метод исследования

Были использованы простые регэкспы, чтобы определить «мусорные» токены в ответах модели. Также было проведено ручное разметка первых 50 ответов, чтобы проверить точность регэкспов.

Результаты

Было обнаружено, что 11,3% выходных токенов уходили на вежливость и мета-комментарии. Самый большой кусок «мусора» составляли мета-комментарии про сам процесс.

Оптимизация модели

Была проведена оптимизация модели, чтобы уменьшить количество «мусорных» токенов. Для этого было добавлено три строки в system prompt. После оптимизации количество «мусорных» токенов уменьшилось до 1,8%.

Экономия

Было подсчитано, что экономия от оптимизации модели может составлять около 9,5% выходных токенов. Для сервиса с 2000 запросами в день это может составлять около 4 200 ₽ в месяц.

Вывод

Было сделано заключение, что оптимизация модели может привести к значительной экономии. Однако, необходимо учитывать специфику каждого сервиса и не удалять вежливость и мета-комментарии в живом чате.

Читать оригинал