Google Cloud представила два новых чипа для ИИ, чтобы конкурировать с Nvidia

Google Cloud анонсировала восьмое поколение своих специализированных чипов для искусственного интеллекта — тензорных процессоров (TPU). Впервые новое поколение делится на две версии: TPU 8t для обучения моделей и TPU 8i для инференса.

Инференс — это процесс использования уже обучённой модели, то есть то, что происходит после ввода пользователем запроса. Новые чипы обещают впечатляющий прирост производительности: обучение моделей ускорится до трёх раз, а эффективность на доллар — на 80%. Кроме того, Google заявила, что сможет объединять более миллиона TPU в один кластер.

Это означает, что вычисления станут мощнее, энергоэффективнее и дешевле для клиентов. Название TPU, а не GPU, сохраняется потому, что эти чипы изначально разрабатывались как низкопотребляющие процессоры на базе архитектуры Tensor.

Дополнение, а не замена

Пока что новые чипы Google не заменяют решения Nvidia — они дополняют их. Как и Microsoft, Amazon и другие гиперскейлеры, Google использует собственные TPU, чтобы расширить, а не вытеснить предложения на базе Nvidia.

Более того, Google пообещала, что в этом году в её облаке появится последний чип Nvidia — Vera Rubin. Это подчёркивает, что даже при росте использования собственных решений, зависимость от Nvidia остаётся.

Почему Nvidia пока вне конкуренции

Со временем крупные облачные провайдеры могут начать меньше зависеть от Nvidia, особенно если компании будут переносить свои ИИ-приложения на специализированные чипы вроде TPU. Но пока что делать ставку против Nvidia слишком рискованно.

Как шутливо отметил аналитик Патрик Мур (Patrick Moore) в соцсети X: ещё в 2016 году, когда Google представила первый TPU, он предположил, что это плохо для Nvidia и Intel. Сегодня Nvidia — компания с капитализацией почти в 5 триллионов долларов, так что его прогноз не оправдался.

Более того, если всё пойдёт по плану Nvidia, рост Google как ИИ-провайдера может принести чипмейкеру больше бизнеса, а не меньше — даже при том, что часть нагрузок будет работать на TPU.

Сотрудничество, а не только конкуренция

Google и Nvidia не только соперничают — они также сотрудничают. Компании договорились совместно разрабатывать сетевые технологии, чтобы системы на базе Nvidia работали в Google Cloud ещё эффективнее.

В частности, они работают над улучшением программной сетевой технологии Falcon, которую Google создала и открыла в 2023 году в рамках инициативы Open Compute Project — одного из главных сообществ по открытым стандартам в дата-центрах.

Читать оригинал