Антиспам на нейронках: Gemini Flash в 1000 раз дешевле GigaChat

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле GigaChat

При разработке SpamAway — антиспам-бота для Telegram — встал вопрос выбора модели. Бот должен в реальном времени проверять сообщения, классифицировать их и при необходимости удалять. Нагрузка небольшая, но постоянная: 10–15 чатов, до 5000 сообщений в сутки.

Стек и условия задачи

Для классификации используется промпт с примерами (few-shot):

  • Средний размер сообщения: 50–100 токенов.
  • Промпт с контекстом и правилами: около 500 токенов.
  • Итого: около 600 токенов на одну проверку.

Цель — найти модель с бесплатным лимитом, достаточным для 1000+ проверок в день без задержек.

GigaChat (Сбер)

Сбер предлагает Freemium-доступ к GigaChat API. На первый взгляд, условия выглядят щедро:

  • 900 000 токенов в год для модели Lite.
  • 50 000 токенов в год для Pro и Max.

Но есть критическое ограничение: один поток. API обрабатывает только один запрос одновременно. Если в чаты приходят сообщения параллельно, они будут обрабатываться по очереди. Для антиспама, где важна скорость, это неприемлемо.

Расчёт лимитов тоже разочаровывает: 900 000 токенов / 600 на проверку = всего 1500 проверок в год. Это меньше пяти в день. В активном чате лимит исчерпывается за полчаса.

YandexGPT (Yandex AI Studio)

У Яндекса нет честного бесплатного тарифа для API. При регистрации в Yandex Cloud даётся стартовый грант (~4000 рублей на 60 дней).

После его окончания цены такие:

  • YandexGPT 5.1 Lite: 20 копеек за 1000 токенов.
  • YandexGPT 5.1 Pro: 40 копеек за 1000 токенов.

Одна проверка стоит около 0,012 рубля. Это недорого, но требует привязки карты, настройки биллинга и оплаты в рублях. Для пет-проекта или Open Source это лишний барьер.

Gemini Flash (Google)

На этом фоне Google Gemini 2.5 Flash выглядит как «чит-код». Бесплатный тариф включает:

  • 15 запросов в минуту (RPM).
  • 1 миллион токенов в день.
  • Нет ограничений на количество потоков (в рамках RPM).

При 600 токенах на проверку это даёт около 1600 проверок в день — полностью бесплатно. Этого более чем достаточно для SpamAway.

Сводная таблица

GigaChat Free
Бесплатный лимит: 1500 проверок в год
Параллельность: нет (1 поток)
Цена (100K токенов): ~6,5 руб (пакет)
Работа из РФ: возможна

YandexGPT (Lite)
Бесплатный лимит: грант на 60 дней
Параллельность: да
Цена (100K токенов): 20 копеек
Работа из РФ: да

Gemini Flash (Free)
Бесплатный лимит: ~1600 проверок в день
Параллельность: да (до 15 RPM)
Цена (100K токенов): бесплатно
Работа из РФ: через прокси/VPN

Ограничения и выводы

Российские модели хорошо понимают русский сленг, сарказм и крипто-офферы. Однако их API-политика не поддерживает маленькие бесплатные проекты. Лимиты Сбера рассчитаны на разовое тестирование, а Яндекс сразу требует перехода в коммерческую инфраструктуру.

Gemini Flash — лучший выбор для селф-хостинга благодаря огромным бесплатным лимитам. Главный риск — доступ из РФ, который решается через прокси.

В SpamAway выбрана именно Gemini Flash. Это позволяет держать бота бесплатным для сообществ, не жертвуя скоростью и качеством фильтрации.

Читать оригинал