Open source-экосистемы: как Сбер развивает GigaChain

Open source-экосистемы: как Сбер развивает GigaChain

Константин Крестников, управляющий директор и техлид команды GigaChain в Сбере, рассказал о развитии open source-экосистемы вокруг GigaChat. Его команда занимается созданием SDK для разработки ИИ-агентов и активно использует открытые технологии для внутренних и внешних решений.

Опыт в open source и ИИ

Константин работает в IT с 2006 года, пройдя путь от разработчика до управляющего директора. Он участвовал в стартапах, включая проект Cubic — первую в мире умную колонку с голосовым ИИ. Разработка велась с нуля: и железо, и софт. Команда реализовала распознавание речи на расстоянии — технологию, которая тогда была передовой. Однако после выхода Amazon Echo конкурировать стало невозможно, и проект был закрыт с возвратом средств инвесторам. Часть команды перешла в Яндекс.

«Когда началась эпоха LLM, я понял, что это важно для Сбера. У нас уже были попытки создать свою языковую модель — они переросли в GigaChat. Для неё нужен был инструмент, чтобы разработчики могли писать под неё приложения».

Почему выбрали open source

Вместо разработки всего с нуля Сбер решил использовать существующие open source-решения. Выбор пал на LangChain — самый популярный фреймворк для создания ИИ-агентов. Он поддерживал множество моделей, имел большую аудиторию и минимизировал зависимость от вендоров.

Так появилась команда GigaChain, которая начала развивать SDK для GigaChat на базе LangChain. Это позволило использовать единый код как внутренним, так и внешним разработчикам.

От форка к пакету совместимости

Изначально GigaChain был форком LangChain. Это было необходимо из-за hardcode-промптов на английском языке — они мешали качественной работе с русскоязычными запросами. GigaChat тогда лучше справлялся с русским, чем другие модели.

«Я пытался договориться с LangChain о поддержке нескольких языков, но это не сработало. Китайские разработчики сталкивались с тем же. Кроме того, нам было понятно, что интеграцию GigaChat в основной репозиторий не примут».

Однако поддержка форка оказалась слишком затратной: каждую неделю поступало 100–200 изменений из основного проекта. Параллельно LangChain стал модульным — крупные компании начали выпускать свои пакеты интеграции.

Команда приняла решение отказаться от форка и создать собственный пакет совместимости. После его установки LangChain полностью работает с GigaChat.

«Мы отправили пул-реквест в LangChain. Его приняли и даже добавили в официальную документацию. Несколько месяцев GigaChat был официально поддерживаемой моделью. Позже наш пакет убрали из документации, но архитектура осталась устойчивой — пользователи продолжают использовать его без проблем».

Преимущества нового подхода

Теперь разработчики в Сбере и за его пределами могут использовать чистый LangChain с пакетом от GigaChain. Это упрощает найм: специалисты с опытом работы с LangChain сразу могут включаться в проекты.

Один из ключевых компонентов — Python-библиотека для интеграции с GigaChat API. Она входит в топ 1,5% самых скачиваемых на PyPI, что говорит о высоком спросе.

Open source как стратегия

Open source помогает решать сразу несколько задач. Во-первых, снижается барьер для переноса агентов на GigaChat. LangChain выступает в роли универсального интерфейса, несмотря на отсутствие единого стандарта (например, OpenAI API нельзя полностью поддерживать из-за внутренних ограничений).

Во-вторых, сообщество само участвует в развитии экосистемы. Например, неизвестный разработчик добавил поддержку GigaChat в LlamaIndex — второй по популярности фреймворк. Пул-реквест был принят, и теперь тысячи пользователей могут использовать GigaChat без дополнительных усилий со стороны Сбера.

«Это прямая выгода от открытого подхода. Мы не тратили на это ресурсы, но получили интеграцию в ещё один крупный проект».

Коммуникация с сообществом

Команда активно взаимодействует с аудиторией:

  • Оперативно отвечает на GitHub и поддерживает документацию.
  • Публикует статьи на Хабре с примерами и разборами кейсов.
  • Ведёт телеграм-каналы с новостями и практическими материалами.
  • Выступает на конференциях — более 15 докладов в 2025 году.
  • Проводит вебинары, где показывает, как создавать агентов с нуля и сравнивать GigaChat с другими моделями.

Особое внимание уделено GigaAgent — открытому автономному агенту. Его развитие велось итеративно: на основе обратной связи от разработчиков и бизнеса добавлялись REPL, инструменты, локальный запуск и модульная архитектура. Сценарии использования — анализ данных, подготовка презентаций, работа с корпоративными источниками.

Лицензирование и правила участия

Сбер использует MIT-лицензии — они не ограничивают использование решений. Все проекты доступны на GitHub и GitVerse.

При выборе сторонних решений команда внимательно изучает лицензии, историю проекта и отношение к пул-реквестам. Если владелец негативно реагирует на интеграцию GigaChat, Сбер не тратит ресурсы на сотрудничество.

Что даёт open source Сберу

Открытый подход приносит три ключевые выгоды:

  • Найм специалистов: используемый стек востребован, что упрощает привлечение кадров.
  • Поддержка сообщества: разработчики сами добавляют интеграции, как в случае с LlamaIndex.
  • Развитие экосистемы: активное участие в open source усиливает позиции GigaChat на рынке ИИ-агентов.

«Возможность развивать open source-стек внутри крупной компании — это моя маленькая гордость. Мы показываем, что даже в таких условиях можно создавать технологии, полезные и для бизнеса, и для сообщества».

Читать оригинал