Как Дженсен Хуанг переопределил понятие «ИИ-инфраструктура»

Как Дженсен Хуанг переопределил понятие «ИИ-инфраструктура»

Триллион долларов подтверждённых заказов на чипы NVIDIA Blackwell и Vera Rubin до 2027 года. Цифра, вдвое превышающая показатель прошлого года. Но ключевое сообщение keynote GTC 2026 — не в масштабах инвестиций, а в смене парадигмы: агентный ИИ требует новой системной архитектуры, и большинство компаний к этому не готовы.

Я много лет наблюдаю за выступлениями Дженсена Хуанга. Он всегда начинает с цифры, от которой захватывает дух. В этот раз это был триллион — не оценка рынка, не прогноз, а реальные заказы. Но за этим числом скрывается нечто большее: сигнал о том, что ИИ перестал быть просто нагрузкой на инфраструктуру. Он сам стал инфраструктурой.

Цифра, которая важнее триллиона

Главное ограничение ИИ-нагрузок 2023–2024 годов — пропускная способность GPU. Но агентный ИИ меняет правила. Когда один агент порождает десятки суб-агентов, вызывает инструменты и поддерживает контекст в параллельных потоках, узким местом становится не вычислительная мощность, а оркестрация.

Именно это отметил чип-аналитик накануне GTC: «Появляются стойки CPU, единственная задача которых — запускать агентный ИИ». Это не про ускорители. Это про системную архитектуру.

Дженсен подтвердил это на квартальном звонке: токены генерируются экспоненциально быстрее, а агентный ИИ — ключевой драйвер. Ответ NVIDIA — Vera Rubin, в 50 раз эффективнее Blackwell H200 по токенам на ватт, и новый Vera CPU, созданный специально для оркестрации агентных рабочих процессов.

Для руководителей по данным: инфраструктура, которую вы планируете, может решать не ту задачу.

OpenClaw, NemoClaw и почему Дженсен сравнил это с Linux

OpenClaw — open-source фреймворк для агентного ИИ от австрийского разработчика Питера Штайнбергера. Дженсен назвал его «самым быстрорастущим open-source проектом в истории». Фреймворк позволяет агентам управлять файлами, подключаться к LLM, использовать инструменты и порождать суб-агентов.

Сравнение с Linux не случайно. Как Linux стал основой корпоративных вычислений, так OpenClaw может стать операционной системой агентной эры.

Вклад NVIDIA — NemoClaw: корпоративный референсный дизайн с элементами безопасности, комплаенс-хуками и интеграцией с политиками доступа. Это ответ на критическую проблему: текущие системы управления ИИ не рассчитаны на мир, где агенты автономно создают тысячи вызовов без участия человека.

Существование NemoClaw — признание: проблема управления реальна, и она наступает быстрее, чем думают большинство организаций.

История данных, спрятанная в keynote

Выступление Дженсена — это, по сути, история о данных, завёрнутая в обёртку GPU. В блоге «ИИ — это пятислойный торт» он объяснил: ИИ требует синхронного масштабирования пяти слоёв — энергии, чипов, инфраструктуры, моделей и приложений. NVIDIA охватывает все пять.

Но ключевая мысль, которую он повторял снова и снова: структурированные данные снова в центре.

Партнёрство с IBM — яркий пример. Ускорение Presto SQL через CUDA позволяет резко ускорить запросы к корпоративным датасетам. Цитата Хуанга: «Данные — это ground truth, которая даёт ИИ контекст и смысл».

Это одновременно комплимент и предупреждение.

Комплимент: ваша инфраструктура данных важна как никогда. Качественные, доступные данные — топливо для агентного ИИ.

Предупреждение: если данные разрознены, плохо управляются или несогласованы, агенты не просто ошибутся — они будут уверенно генерировать дорогие, масштабные ошибки.

Что архитектура Vera Rubin означает для вашего инфраструктурного бюджета

По данным Semi Analysis, Vera Rubin выдаёт в 50 раз больше токенов на ватт, чем Blackwell H200. В связке с Groq 3 LPX через NVIDIA Dynamo — в 35 раз больше пропускной способности на мегаватт.

Это меняет экономику инференса. Стоимость миллиона токенов в агентных системах будет радикально ниже, чем сегодня.

Если вы сейчас планируете инфраструктуру — облачные контракты, on-prem инвестиции, гибридные решения — вы делаете это без знания реальных кривых стоимости железа, которое будет доминировать через 18 месяцев.

Мой подход:

  • Закладываю гибкость — короткие контракты, мобильность рабочих нагрузок между облаками.
  • Запускаю on-prem эксперименты с open-source моделями, не дожидаясь новых чипов.
  • Бюджетирую под сценарий, где стоимость инференса падает на 60–80% в год.

Инвестиции, оправданные в 2024, могут стать нерелевантными уже в 2026.

Сигнал на триллион: что он означает для вашей ИИ-стратегии

Триллион долларов заказов — это не просто цифра. Это подтверждённые обязательства гиперскейлеров, суверенных инициатив и крупных предприятий. Гонка инфраструктурного вооружения не замедляется — она ускоряется.

Для средних компаний — это и давление, и возможность.

Давление: разрыв между возможностями передовых игроков и вашей организацией будет расти. Гиперскейлеры строят рвы в экзафлопсах.

Возможность: через 2–3 года вычисления уровня Vera Rubin станут доступны через API. Выигрывают не те, кто пытается повторить железо гиперскейлеров, а те, кто готовит фундамент — данные, управление, компетенции — чтобы эффективно использовать эти возможности.

Что я делаю прямо сейчас

После keynote я провёл 48 часов, работая над тремя вещами.

Во-первых, инициировал пересмотр фреймворка управления агентами. У нас есть политики доступа моделей к данным, но нет — для агентов, их суб-агентов и автономных вызовов инструментов. Этот разрыв нужно закрыть до первого продакшн-запуска.

Во-вторых, привлёк инфраструктурную команду к пересмотру дорожной карты на 2026–2027. Мы не меняем планы, но стресс-тестируем все допущения на фоне новых экономических и архитектурных реалий.

В-третьих, запустил инициативу по документированию слоя управления данными. Если данные — это ground truth для агентов, то качество данных, lineage и контроль доступа напрямую влияют на надёжность ИИ в продакшне.

Неудобный вопрос с GTC 2026

Дженсен Хуанг построил выступление вокруг одной идеи: ИИ стал инфраструктурой промышленного масштаба, токены — продуктом, а все корпоративные слои должны быть перепроектированы под это.

Он прав. Инструментарий развивается быстрее, чем организационная готовность. Инфраструктура масштабируется быстрее, чем управление.

Keynote подтвердил: вопрос не в том, будет ли ваша организация использовать агентный ИИ. Вопрос в том, готова ли ваша инфраструктура данных стать той ground truth, на которой он будет строиться.

Большинство организаций — нет. Их данные не готовы. Их фреймворки управления не готовы. Их команды не думают в терминах инфраструктуры.

NVIDIA уже сказала: железо придёт в любом случае.

Готовы ли ваши данные стать фундаментом, на котором оно будет работать?

Вот вопрос, с которым я ушёл с GTC 2026. И именно он, скорее всего, определит, какие команды по данным построят устойчивые системы — а какие будут год проводить в тушении пожаров от масштабных, уверенных ошибок ИИ.

Читать оригинал