При разработке SpamAway — антиспам-бота для Telegram — встал вопрос выбора модели. Бот должен в реальном времени проверять сообщения, классифицировать их и при необходимости удалять. Нагрузка небольшая, но постоянная: 10–15 чатов, до 5000 сообщений в сутки.
Стек и условия задачи
Для классификации используется промпт с примерами (few-shot):
- Средний размер сообщения: 50–100 токенов.
- Промпт с контекстом и правилами: около 500 токенов.
- Итого: около 600 токенов на одну проверку.
Цель — найти модель с бесплатным лимитом, достаточным для 1000+ проверок в день без задержек.
GigaChat (Сбер)
Сбер предлагает Freemium-доступ к GigaChat API. На первый взгляд, условия выглядят щедро:
- 900 000 токенов в год для модели Lite.
- 50 000 токенов в год для Pro и Max.
Но есть критическое ограничение: один поток. API обрабатывает только один запрос одновременно. Если в чаты приходят сообщения параллельно, они будут обрабатываться по очереди. Для антиспама, где важна скорость, это неприемлемо.
Расчёт лимитов тоже разочаровывает: 900 000 токенов / 600 на проверку = всего 1500 проверок в год. Это меньше пяти в день. В активном чате лимит исчерпывается за полчаса.
YandexGPT (Yandex AI Studio)
У Яндекса нет честного бесплатного тарифа для API. При регистрации в Yandex Cloud даётся стартовый грант (~4000 рублей на 60 дней).
После его окончания цены такие:
- YandexGPT 5.1 Lite: 20 копеек за 1000 токенов.
- YandexGPT 5.1 Pro: 40 копеек за 1000 токенов.
Одна проверка стоит около 0,012 рубля. Это недорого, но требует привязки карты, настройки биллинга и оплаты в рублях. Для пет-проекта или Open Source это лишний барьер.
Gemini Flash (Google)
На этом фоне Google Gemini 2.5 Flash выглядит как «чит-код». Бесплатный тариф включает:
- 15 запросов в минуту (RPM).
- 1 миллион токенов в день.
- Нет ограничений на количество потоков (в рамках RPM).
При 600 токенах на проверку это даёт около 1600 проверок в день — полностью бесплатно. Этого более чем достаточно для SpamAway.
Сводная таблица
GigaChat Free
Бесплатный лимит: 1500 проверок в год
Параллельность: нет (1 поток)
Цена (100K токенов): ~6,5 руб (пакет)
Работа из РФ: возможна
YandexGPT (Lite)
Бесплатный лимит: грант на 60 дней
Параллельность: да
Цена (100K токенов): 20 копеек
Работа из РФ: да
Gemini Flash (Free)
Бесплатный лимит: ~1600 проверок в день
Параллельность: да (до 15 RPM)
Цена (100K токенов): бесплатно
Работа из РФ: через прокси/VPN
Ограничения и выводы
Российские модели хорошо понимают русский сленг, сарказм и крипто-офферы. Однако их API-политика не поддерживает маленькие бесплатные проекты. Лимиты Сбера рассчитаны на разовое тестирование, а Яндекс сразу требует перехода в коммерческую инфраструктуру.
Gemini Flash — лучший выбор для селф-хостинга благодаря огромным бесплатным лимитам. Главный риск — доступ из РФ, который решается через прокси.
В SpamAway выбрана именно Gemini Flash. Это позволяет держать бота бесплатным для сообществ, не жертвуя скоростью и качеством фильтрации.