«Дайте мне токены. Просто дайте токены. Мне нужно быстро. Дёшево. Прямо сейчас».
Так звучит манифест разработчиков, создающих ПО на основе генеративных моделей искусственного интеллекта (artificial intelligence, AI), — или хотя бы так это описывает Майк Генри (Mike Henry), CEO компании Parasail. Его стартап предоставляет облачные мощности для вывода (inference) моделей ИИ, и, по его словам, генерирует 500 миллиардов токенов в день. Вот он, настоящий токенмаксинг (tokenmaxxing).
От чипов к облачным решениям
Генри ранее работал в Groq — компании, специализирующейся на чипах для крупных языковых моделей (LLM). Там он создавал облачное предложение, осознав ещё тогда, что разработчикам нужны специализированные вычислительные мощности. Спустя год после выхода из режима скрытности Parasail привлёк $32 млн в рамках серии А, чтобы масштабировать свой сервис.
Хотя у Генри опыт в проектировании физических чипов, Parasail не стремится владеть собственными процессорами. Часть GPU — в собственности компании, но основные вычисления арендуются в 40 дата-центрах по 15 странам. Дополнительные мощности Parasail покупает на рынках ликвидности, гибко распределяя нагрузку и снижая стоимость обработки запросов.
Гибкость против монолитов
Умное распределение задач и избегание пиков нагрузки позволяют стартапу конкурировать с компаниями, владеющими собственным «железом», но ограниченными долгосрочными обязательствами перед крупными клиентами.
Успех Parasail во многом зависит от роста числа открытых моделей и агентов за пределами ведущих лабораторий вроде Anthropic и ОпенЭйАй (OpenAI). По словам топ-менеджеров и инвесторов Parasail, это вызвано растущей стоимостью и неудобствами при использовании закрытых API.
Гибрид будущего
Андреас Штюльмюллер (Andreas Stuhlmüller), CEO стартапа Elicit, который привлёк $22 млн на создание ИИ-ассистента для научных исследований, подтверждает: его клиенты в крупных фармкомпаниях уже переходят к открытым моделям.
«Мы всё больше используем открытые модели, потому что отправлять сотни тысяч запросов в API — это тяжело».
Теперь, когда Elicit активно внедряет ИИ-агентов, разбивающих задачи на этапы и работающих в долгосрочной перспективе, стратегия меняется: сначала дешёвые открытые модели проводят первичную фильтрацию, а затем более мощные — дают финальный ответ.
Инференс как новая норма
Рост числа запросов к моделям, особенно с распространением агентов, стимулирует инвестиции в инфраструктуру вроде Parasail. Сэмир Кумар (Samir Kumar), партнёр Touring Capital, соинвестировавший в раунде, считает, что в будущем инференс будет стоить не менее 20% от общей стоимости разработки ПО.
Как выделиться на фоне конкурентов? Parasail делает ставку на узкую специализацию: только инференс, без обучения моделей. Кроме того, компания работает с стартапами на ранних стадиях без долгосрочных контрактов — в отличие от крупных облачных провайдеров, ориентированных на корпоративный сектор, и таких конкурентов, как Fireworks AI и Baseten.
Правда, есть и риски: вся клиентская база — это seed- и Series B-стартапы в непредсказуемой сфере ИИ.
Стив Дженг (Steve Jang) из Kindred Ventures, второй соинвестор раунда, уверен: экономика развёртывания моделей требует именно такого брокерства вычислительных мощностей. А это — только начало, до массового внедрения ИИ в генерацию контента и робототехнику.
«Все думали, что это пузырь. Но никакого пузыря нет. Спрос на инференс растёт быстрее, чем предложение».