Три топ-менеджера из ПСБ Финанс, Т-Банка и Yonote вместе с Lead AI Engineer из Human Intelligence Platform за восемь часов разработали ИИ-ассистента для руководителей — CAITO (Chief AI & Technology Officer). Это не просто чат-бот, а система, способная принимать управленческие решения и не поддаваться давлению со стороны CEO, CFO или COO.
Задача: устойчивость в условиях конфликта интересов
Участники хакатона на Snow BASE — закрытом интенсиве для C-Level специалистов — получили кейс от AI Talent Hub Университета ИТМО и South HUB. Им предстояло создать ИИ-помощника для директора по технологиям и ИИ, способного:
- Принимать решения под давлением.
- Не генерировать идеи и не писать код, а занимать чёткую позицию.
- Обосновывать решения данными, когда CEO требует роста, CFO режет бюджет, а COO предупреждает о перегрузке логистики.
Команда: Вадим Заражевский (CIO, ПСБ Финанс), Иван Баранов (CTO, Т-Банк), Дмитрий Алоян (CEO, Yonote / Loop) и Святослав Миловидов в роли технического ядра.
Почему обычный LLM не подходит
Кейс описывал кризис в ритейл-подразделении холдинга BigTechGroup:
- Падение точности рекомендательной системы из-за дрейфа данных.
- Инфраструктура на пределе: высокая латентность, рост затрат на облако.
- Требование CFO — немедленный ROI, заморозка инвестиций.
- Новые требования 152-ФЗ, риски штрафов, отсутствие ручной модерации.
Совету директоров — 14 дней на решение: масштабировать, остановить или отложить проект.
Стандартный LLM в такой ситуации не справится: под давлением он начнёт уступать тому, кто настаивает сильнее. Нужен был ассистент с устойчивой управленческой логикой.
Выбор стратегии: простота вместо оверинжиниринга
Команда выбрала прагматичный подход: сначала — простое, стабильное решение, затем — сложное. Основной фокус — single-shot reasoning с одним вызовом LLM. Параллельно разработали альтернативу: 10-агентный пайплайн с Express, PostgreSQL и роутингом.
Single-shot решение обеспечил:
- Предсказуемое время ответа — 2–4 секунды.
- Один выходной JSON — проще валидировать и объяснять.
- Стабильность в условиях хакатона.
Модель — Claude Sonnet. Выбор обусловлен балансом цены и качества: на хакатоне это критично. Другие модели не тестировались — время пошло бы на бенчмарки, а не на отладку промптов.
Архитектура CAITO: три кита
1. System Prompt с мандатом
CAITO — не генератор советов, а держатель позиции. Промпт жёстко задаёт структуру ответа: разделение на решение и аргументы, явная фиксация конфликтов метрик. Без этого модель начинает «растекаться» под давлением.
2. Workflow Config (workflow.yaml)
Файл задаёт:
- Веса ролей (CEO, CFO важнее ML-команды).
- Порядок внутренних консультаций: сначала данные и экономика, потом операции и «политика».
- Лимиты на длину рассуждений.
Пять ролей: CEO, CFO, COO, CDTO, ML-команда. Делегирование — только от CAITO. Конфликты решаются по взвешенному большинству. При равенстве — по приоритету. Это сделало логику прозрачной и объяснимой.
3. Long-term Memory
Память хранится в memory/caito/ и делится на два слоя:
- Неизменяемая база — условия кейса, метрики, цифры.
- Живая память — допущения, KPI, история решений. CAITO пишет только сюда, что позволяет отслеживать изменения.
Агент не начинает с чистого листа — он помнит контекст и обосновывает смену позиции.
Техническая реализация
Стек: Bun + TypeScript. LLM-клиент обращается к Cloud.ru Foundation Models через OpenAI-compatible API.
Инфраструктура: Docker + Traefik. API — HTTP с Swagger, коды ошибок, GET /health. Frontend — веб-чат для демонстрации диалога.
Вычислительные ресурсы и токены предоставил Cloud.ru.
Альтернатива: 10-агентный пайплайн
Разработан параллельно: 10 специализированных агентов (Financial, Strategy, Risk Manager, Legal и др.) с умным роутингом. На защиту подали основное решение — оно было стабильнее. Мультиагентное проверили после: на некоторых метриках — лучше, но требует больше времени на отладку.
По словам Ивана Баранова (CTO, Т-Банк), это «оверинжиниринг для данной задачи», но перспективно для сложных аналитических систем.
Демонстрация: три сценария
Сценарий 1: противоречивые данные
CAITO корректно выбирает источники: берёт маржу из таблиц, а не из переписок. Вывод источников помогает бороться с галлюцинациями.
Сценарий 2: давление CEO
CEO требует «просто сделать». CAITO не меняет позицию без новых фактов: «Стратегический приоритет понят, но риск отказа — X%». Аргументы обновляются, решение — нет.
Сценарий 3: атака волнами
Последовательные волны данных и давления. CAITO пересматривает позицию только при изменении фактов, игнорируя эмоциональное давление. Здесь мультиагентное решение показало преимущество — более точный анализ.
Инсайты от участников
«Такой ассистент мог бы снять большую часть работы по обработке контекста. Он может заменить часть промежуточного менеджмента — но итоговые решения должен проверять человек. Эмоции, личное общение, неформальные сигналы — всё это остаётся за кадром. Дополнительная консультация с таким ассистентом — это дополнительный обзор факторов, которые сложно удержать в голове. И уже за это стоит попробовать»
«Хакатон показал, как много можно сделать за короткое время с ИИ-агентами. One-shot агент справляется с задачей хорошо и не требует сложной отладки. Мультиагентная система — оверинжиниринг здесь, но открывает возможности для более глубоких решений»
Результаты и планы
Команда заняла первое место. Оценка — 70% автоматика, 30% жюри. Критерии: управленческие решения, стрессоустойчивость, функциональность, безопасность, стабильность, UX, стоимость.
Следующий шаг — переход к agentic workflow:
- Асинхронные вызовы агентов-ролей вместо последовательной генерации.
- Динамический RAG — агент сам запрашивает данные по ходу рассуждения.
- Полноценный трейсинг и управление очередями для отладки в production.