Как китайские ИИ-модели обогнали американские по реальному потреблению

Habr AI 22 мар 2026

Модель под названием Hunter Alpha появилась из ниоткуда и за 96 часов достигла 0,666 триллиона токенов в неделю — седьмое место в глобальном рейтинге OpenRouter. Ни сайта, ни компании-создателя. Только мощная модель, оптимизированная под агентные задачи.

Данные OpenRouter показывают: китайские модели на прошлой неделе выдали 4,69 триллиона токенов. Американские — 3,29 триллиона. Вторую неделю подряд.

Это не случайность. Это флиппенинг — смена лидерства в реальном использовании ИИ.

Мираж бенчмарков

Открытые рейтинги до сих пор возглавляют OpenAI и Gemini. Но продакшен-данные рассказывают другую историю.

MiniMax M2.5 — первое место на OpenRouter пять недель подряд, с 1,75 триллиона токенов. Step 3.5 Flash — рост на 79% за неделю. DeepSeek V3.2 — на 25%.

Это не экспериментальные модели. Это рабочие лошадки, на которых строят реальные приложения.

Генеральный директор Airbnb Брайан Чески в декабре заявил: «Мы во многом полагаемся на модель Qwen от Alibaba. Она очень хорошая… быстрая и дешёвая. Мы используем новейшие модели OpenAI, но обычно не применяем их в продакшене».

Американские компании признают: OpenAI — не выбор для массового развёртывания.

Китай строил для агентов. США — для чата

Бенчмарки тестируют способность отвечать на вопросы. Продакшен требует выполнения задач — и это другая игра.

Агентные фреймворки, такие как OpenClaw, взорвались в начале 2026 года. Все крупные китайские лаборатории — Moonshot AI, MiniMax, Zhipu, Tencent — быстро запустили совместимые модели.

Агентные задачи могут потреблять от 100 000 до более чем миллиона токенов за один запуск. Это в 10–100 раз больше, чем обычный чат.

Эра агентов вознаграждает одну метрику: стоимость за задачу.

MiniMax M2.5: $0,30 на вход, $1,10 на выход за миллион токенов. Claude Opus 4.6: $5 на вход, $25 на выход. При масштабных нагрузках разница становится критической.

Команда OpenRouter подтвердила: «Китай стал серьёзной силой — не только за счёт внутреннего потребления, но и за счёт производства глобально конкурентоспособных моделей».

Кто такой Hunter Alpha?

11 марта 2026 года на OpenRouter появилась модель с 1 триллионом параметров. Название — Hunter Alpha. Контекст — миллион токенов. Полная совместимость с OpenClaw.

Через четыре дня — 0,666 триллиона токенов в неделю. Выше Kimi. Выше большинства американских моделей.

Никакой информации о создателе. Ни сайта, ни блога. Только модель, которая мгновенно стала одной из самых используемых в мире.

Китайские модели с открытыми весами теперь составляют 17% глобальных скачиваний на Hugging Face. Американские — 15,8%. Впервые Китай обогнал США по adoption открытых моделей.

Один разработчик на Hacker News написал: «Я только что перенёс весь наш агентный стек на MiniMax. Счёт за токены упал на 80% за ночь. Мне страшно и радостно одновременно».

Дело не в чипах. Дело в энергии и экосистеме

Экспортные ограничения на чипы не решают главного: инференс важнее обучения. Китай уже имеет достаточно вычислительных мощностей для текущего спроса.

Энергетическая инфраструктура даёт структурное преимущество: потребление электроэнергии в Китае вдвое выше, чем в США, почти половина — из возобновляемых источников. Это снижает стоимость инференса на уровне всей экосистемы.

Капитальные затраты на ИИ-инфраструктуру в США к 2027 году достигнут 700 миллиардов долларов. В Китае — около 35 миллиардов. Разрыв — 20 к 1.

При этом китайские модели соответствуют или превосходят американские по производительности за долю стоимости. Kimi K2 Thinking обучена менее чем за 5 миллионов долларов. Сравнимые американские модели стоят в 10 раз дороже.

В январе ВМС США запретили DeepSeek из-за соображений конфиденциальности. Но инженеры оборонного подрядчика тайно тестировали ту же модель для логистики. Рынок не ждёт разрешения от политиков.

Аргумент в пользу американского ИИ

У США остаются козыри. Экспортные ограничения на чипы могут в будущем замедлить развитие китайских моделей нового поколения.

Геополитические риски реальны. ВМС США запретили DeepSeek. Дальнейшие ограничения возможны. Компании в регулируемых отраслях могут оставаться с американскими вендорами из соображений комплаенса.

Один технический директор из Кремниевой долины сказал: «Мы не можем позволить себе ставить бизнес на модели, которые могут быть запрещены за одну ночь. Надёжность и доверие по-прежнему важны».

Но доверие — это роскошь. Стоимость — необходимость.

Как реагировать на флиппенинг

Флиппенинг — не прогноз. Это уже произошло. Вот как адаптироваться.

Смените метрику оценки. Перестаньте смотреть на бенчмарки. Лучшая модель — та, которую вы можете позволить себе запускать в масштабе. Сейчас это китайские модели.

Немедленные шаги:

Проведите аудит расходов на токены. Посчитайте стоимость за миллион токенов по каждой нагрузке. Если вы используете OpenAI или Claude для агентных задач — вы переплачиваете в 4–10 раз.
Протестируйте одну китайскую модель. Запустите некритичную задачу на MiniMax M2.5 или DeepSeek V3.2. Сравните стоимость, задержку и качество. Доверяйте своим данным, а не заголовкам.
Проверьте совместимость с OpenClaw. Если вы строите агентов, убедитесь, что ваш фреймворк поддерживает стандарт. Иначе вы на устаревшем стеке.

Для команд и руководителей:

Создайте пайплайн оценки — песочницу для безопасного тестирования китайских моделей. Фиксируйте производительность и поведение.
Диверсифицируйте поставщиков. Архитектурируйте стек так, чтобы можно было менять провайдеров через API. Победит тот, кто сможет быстро перейти на самое выгодное решение.

Антипаттерны:

Не считайте, что «лучший в бенчмарках» = лучший в продакшене. Это разные задачи.
Не ждите разрешения от регуляторов. Ваши конкуренты уже перешли на китайские модели.

Если вы в оборонке, финансах или здравоохранении — вопросы суверенитета данных могут перевесить экономию. Признайте этот компромисс.

Новая реальность

Флиппенинг — это не событие. Это новая базовая линия.

Объём токенов — окончательное голосование доверия. Разработчики выбрали стоимость. Выбрали агентов. Выбрали Китай.

США могут жаловаться на нечестные условия — или адаптироваться. Адаптация начинается с признания: правила игры изменились.

Дело больше не в бенчмарках. Дело в том, кто управляет инфраструктурой, которую мир реально использует.

Hunter Alpha сегодня — призрак. Завтра он может стать единственной игрой в городе.

Прогноз: создатель Hunter Alpha будет раскрыт в течение 60 дней. И это будет не один из обычных подозреваемых.

Вопрос: вы строите на правильном стеке?

Читать оригинал

Как китайские ИИ-модели обогнали американские по реальному потреблению

Мираж бенчмарков

Китай строил для агентов. США — для чата

Кто такой Hunter Alpha?

Дело не в чипах. Дело в энергии и экосистеме

Аргумент в пользу американского ИИ

Как реагировать на флиппенинг

Новая реальность

Как китайские ИИ-модели обогнали американские по реальному потреблению

Появление призрака

Мираж бенчмарков

Китай строил для агентов. США строили для чата

Кто такой Hunter Alpha?

Дело не только в моделях. Дело в энергии и экосистеме

Аргумент в пользу американского ИИ

Как выжить в «флиппенинге»

Новая карта