24 марта OpenAI объявила о закрытии Sora, и многие восприняли это как признак того, что AI-пузырь начал сдуваться: мол, хайп закончился, экономика не сошлась, наступает конец эпохи.
Но за неделю до этого Дженсен Хуанг, основатель и CEO NVIDIA, на конференции GTC 2026 выступил с провокационным тезисом: если инженер с зарплатой $500 тыс. тратит на токены меньше $250 тыс. в год — это тревожный сигнал. Если всего $5 тыс. — катастрофа.
На первый взгляд, это противоречит закрытию Sora — одного из самых ресурсоёмких AI-продуктов. Но обе новости говорят об одном: токены нужно тратить больше, но только там, где они приносят реальную отдачу.
Токены стали дешевле. Почему дефицит вычислений только растёт?
Стоимость токенов с 2023 по 2026 год значительно снизилась:
- GPT-4 (март 2023)
- GPT-4o (август 2024)
- Gemini 2.0 Flash (февраль 2025)
- DeepSeek с кэшированием (февраль 2025)
Казалось бы, дешевизна должна снизить нагрузку на вычисления. Но произошло обратное. Этот феномен ещё в XIX веке описал Уильям Стэнли Джевонс:
Когда использование ресурса становится эффективнее и дешевле, его начинают не экономить, а потреблять больше — потому что становятся доступными задачи, ранее нерентабельные.
Дешевые токены открыли путь к десяткам новых AI-сценариев. Если раньше окупались десять задач, теперь — сто. Суммарное потребление вычислительных мощностей растёт.
По данным Menlo Ventures, корпоративные расходы на генеративный AI выросли с $11,5 млрд в 2024 году до $37 млрд в 2025-м. Даже при удешевлении токенов общий счёт за AI увеличивается.
При этом растёт и «теневой» AI: по исследованию BlackFog (2000 сотрудников в США и Великобритании, январь 2026), 49% используют несанкционированные AI-инструменты, а 51% подключают их к корпоративным системам в обход IT, нередко загружая данные под NDA. Реальные расходы на AI выше официальных — часть трат идёт через личные карты сотрудников.
Почему первым под нож пошло именно видео?
Ответ прост: видео — одна из самых ресурсоёмких задач. По оценкам, генерация минутного ролика при 30 кадрах в секунду требует вычислительных мощностей в разы больше, чем текстовый ответ или изображение.
OpenAI, несмотря на выручку более $13 млрд, столкнулась с ростом расходов на инференс в 2025 году в четыре раза. Скорректированная валовая маржа упала с 40% до 33% — вместо целевых 46%. В таких условиях компании приходится задавать жёсткие вопросы: сколько стоит каждый продукт, какую приносит прибыль и можно ли использовать вычисления эффективнее.
Токены как метрика эффективности: спорно, но не бессмысленно
Заявление Хуанга легко принять за рекламу: CEO компании, продающей GPU, призывает тратить больше на GPU. Конфликт интересов очевиден.
Но суть в другом. Инженер, который не использует AI-агентов для рутины, — как разработчик чипов, рисующий схемы от руки. Современные чипы содержат миллиарды транзисторов, проектирование которых без алгоритмов невозможно. Работать без AI — технически возможно, но конкуренты за это время выпустят три поколения продуктов.
Расход токенов — неидеальная метрика, её можно накрутить. Но за ней стоит важный вопрос: использует ли инженер инструменты новой эпохи или работает так, будто на дворе всё ещё 2020 год?
Что будет дальше
Это не кризис и не конец AI. Это переход к зрелой фазе рынка.
Если в 2023–2024 годах AI-продукты запускались по принципу «вроде прикольно, посмотрим, что получится», то к 2026 году требуется ответ на другой вопрос: сколько это стоит и какую приносит отдачу.
Sora стала первой крупной жертвой этой новой рациональности. Но не последней. AI не заканчивается. Заканчивается эпоха, в которой за красивую демонстрацию никто не спрашивал счёт.