Закрытие Sora — не конец AI-пузыря. Это его взросление

Habr AI 31 мар 2026

24 марта OpenAI объявила о закрытии Sora, и многие восприняли это как признак того, что AI-пузырь начал сдуваться: мол, хайп закончился, экономика не сошлась, наступает конец эпохи.

Но за неделю до этого Дженсен Хуанг, основатель и CEO NVIDIA, на конференции GTC 2026 выступил с провокационным тезисом: если инженер с зарплатой $500 тыс. тратит на токены меньше $250 тыс. в год — это тревожный сигнал. Если всего $5 тыс. — катастрофа.

На первый взгляд, это противоречит закрытию Sora — одного из самых ресурсоёмких AI-продуктов. Но обе новости говорят об одном: токены нужно тратить больше, но только там, где они приносят реальную отдачу.

Токены стали дешевле. Почему дефицит вычислений только растёт?

Стоимость токенов с 2023 по 2026 год значительно снизилась:

GPT-4 (март 2023)
GPT-4o (август 2024)
Gemini 2.0 Flash (февраль 2025)
DeepSeek с кэшированием (февраль 2025)

Казалось бы, дешевизна должна снизить нагрузку на вычисления. Но произошло обратное. Этот феномен ещё в XIX веке описал Уильям Стэнли Джевонс:

Когда использование ресурса становится эффективнее и дешевле, его начинают не экономить, а потреблять больше — потому что становятся доступными задачи, ранее нерентабельные.

Дешевые токены открыли путь к десяткам новых AI-сценариев. Если раньше окупались десять задач, теперь — сто. Суммарное потребление вычислительных мощностей растёт.

По данным Menlo Ventures, корпоративные расходы на генеративный AI выросли с $11,5 млрд в 2024 году до $37 млрд в 2025-м. Даже при удешевлении токенов общий счёт за AI увеличивается.

При этом растёт и «теневой» AI: по исследованию BlackFog (2000 сотрудников в США и Великобритании, январь 2026), 49% используют несанкционированные AI-инструменты, а 51% подключают их к корпоративным системам в обход IT, нередко загружая данные под NDA. Реальные расходы на AI выше официальных — часть трат идёт через личные карты сотрудников.

Почему первым под нож пошло именно видео?

Ответ прост: видео — одна из самых ресурсоёмких задач. По оценкам, генерация минутного ролика при 30 кадрах в секунду требует вычислительных мощностей в разы больше, чем текстовый ответ или изображение.

OpenAI, несмотря на выручку более $13 млрд, столкнулась с ростом расходов на инференс в 2025 году в четыре раза. Скорректированная валовая маржа упала с 40% до 33% — вместо целевых 46%. В таких условиях компании приходится задавать жёсткие вопросы: сколько стоит каждый продукт, какую приносит прибыль и можно ли использовать вычисления эффективнее.

Токены как метрика эффективности: спорно, но не бессмысленно

Заявление Хуанга легко принять за рекламу: CEO компании, продающей GPU, призывает тратить больше на GPU. Конфликт интересов очевиден.

Но суть в другом. Инженер, который не использует AI-агентов для рутины, — как разработчик чипов, рисующий схемы от руки. Современные чипы содержат миллиарды транзисторов, проектирование которых без алгоритмов невозможно. Работать без AI — технически возможно, но конкуренты за это время выпустят три поколения продуктов.

Расход токенов — неидеальная метрика, её можно накрутить. Но за ней стоит важный вопрос: использует ли инженер инструменты новой эпохи или работает так, будто на дворе всё ещё 2020 год?

Что будет дальше

Это не кризис и не конец AI. Это переход к зрелой фазе рынка.

Если в 2023–2024 годах AI-продукты запускались по принципу «вроде прикольно, посмотрим, что получится», то к 2026 году требуется ответ на другой вопрос: сколько это стоит и какую приносит отдачу.

Sora стала первой крупной жертвой этой новой рациональности. Но не последней. AI не заканчивается. Заканчивается эпоха, в которой за красивую демонстрацию никто не спрашивал счёт.

Читать оригинал

Закрытие Sora — не конец AI-пузыря. Это его взросление

Токены стали дешевле. Почему дефицит вычислений только растёт?

Почему первым под нож пошло именно видео?

Токены как метрика эффективности: спорно, но не бессмысленно

Что будет дальше

Закрытие Sora — не конец AI-пузыря. Это его взросление

Токены стали дешевле. Почему тогда дефицит вычислений только вырос?

Почему под нож первым пошло именно видео

Токены как метрика работы: спорно, но не бессмысленно

Что будет дальше