Токен-максинг делает разработчиков менее продуктивными, чем они думают

Существует одна из старых управленческих истин: то, что вы измеряете, имеет значение. И, как правило, вы получаете больше того, что измеряете.

Разработчики программного обеспечения обсуждают метрики производительности на протяжении десятилетий, начиная с количества строк кода. Но с появлением нового поколения инструментов кодирования на основе ИИ, которые генерируют больше кода, чем когда-либо прежде, становится неясным, что именно должны измерять их руководители.

Проблема токен-максинга

Огромные токен-бюджеты, по сути, количество мощности ИИ, которое разработчик может использовать, стали символом чести среди разработчиков в Кремниевой долине. Однако это довольно странный способ думать о производительности. Измерение входных данных процесса не имеет смысла, когда вы заботитесь об выходных данных.

Рассмотрим доказательства из новой категории компаний, работающих в области анализа производительности разработчиков. Они обнаруживают, что разработчики, использующие инструменты вроде Клод Код (Claude Code), Курсор (Cursor) и Кодекс (Codex), генерируют гораздо больше принятого кода, чем раньше. Но они также находят, что инженеры должны возвращаться, чтобы пересмотреть этот принятый код гораздо чаще, чем раньше, что подрывает утверждения об увеличении производительности.

Алекс Чирчеи, генеральный директор и основатель Уэйдев (Waydev), строит слой интеллекта для отслеживания этих динамик; его компания работает с 50 разными клиентами, которые нанимают более 10 000 разработчиков программного обеспечения.

Он говорит, что менеджеры по инженерии видят уровень принятия кода в 80-90%, что означает долю кода, сгенерированного ИИ, которую разработчики одобряют и сохраняют, но они пропускают переработку, которая происходит, когда инженеры должны пересмотреть этот код в последующие недели, что снижает фактический уровень принятия кода на 10-30% от сгенерированного кода.

Новые инструменты для анализа кода

Рост инструментов кодирования на основе ИИ привел к тому, что Уэйдев, основанная в 2017 году для предоставления аналитики разработчиков, полностью переработала свою платформу за последние шесть месяцев, чтобы решить проблему быстрого кодирования. Теперь компания выпускает новые инструменты, которые отслеживают метаданные, сгенерированные агентами ИИ, предлагая аналитику качества и стоимости их кода, чтобы предоставить менеджерам по инженерии более глубокое понимание как принятия ИИ, так и его эффективности.

Хотя аналитические компании имеют стимул подчеркивать проблемы, которые они находят, доказательства накапливаются, что крупные организации все еще разрабатывают, как использовать инструменты ИИ эффективно. Крупные компании заметили — Атласиан (Atlassian) приобрела ДХ (DX), еще одну стартап-интеллектуальную платформу для инженерии, за 1 миллиард долларов в прошлом году, чтобы помочь своим клиентам понять возврат на инвестиции в агентов кодирования.

Данные из всей отрасли рассказывают последовательную историю: больше кода пишется, но непропорционально большая часть его не сохраняется.

ГитКлир (GitClear), еще одна компания в этой области, опубликовала отчет в январе, в котором было обнаружено, что инструменты ИИ увеличили производительность, но также показали, что их данные показали «регулярные пользователи ИИ в среднем имели на 9,4 раза больше кодовой переработки, чем их аналоги без ИИ» — более чем в два раза больше, чем прирост производительности, обеспечиваемый инструментами.

Фарос ЭйАй (Faros AI), платформа аналитики инженерии, опиралась на два года данных клиентов для своего отчета марта 2026 года. Результат: кодовая переработка — строки кода, удаленные по сравнению со строками, добавленными, — увеличилась на 861% при высоком уровне принятия ИИ.

Джелифиш (Jellyfish), которая позиционирует себя как интеллектуальная платформа для инженерии, интегрированной с ИИ, собрала данные на 7548 инженерах в первом квартале 2026 года. Компания обнаружила, что инженеры с самыми большими токен-бюджетами производили наибольшее количество запросов на изменения (предлагаемых изменений в общей базе кода), но улучшение производительности не масштабировалось. Они достигли удвоения производительности при десятикратном увеличении стоимости токенов. Другими словами, инструменты генерируют объем, а не ценность.

Такие статистические данные подтверждаются, когда вы говорите с разработчиками, которые обнаруживают, что код-ревью и технический долг накапливаются, даже когда они наслаждаются свободой новых инструментов. Одним из распространенных выводов является разница между старшими и младшими инженерами, при которой последние принимают гораздо больше кода, сгенерированного ИИ, и сталкиваются с большим количеством переписывания в результате.

Тем не менее, даже когда разработчики работают над пониманием того, что их агенты делают, они не ожидают отказаться от этого в ближайшее время.

«Это новая эра разработки программного обеспечения, и вам нужно адаптироваться, и вы вынуждены адаптироваться как компания», — сказал Чирчеи ТехКранчу (TechCrunch). «Это не будет циклом, который пройдет».

Читать оригинал