Как CEO, CTO и CIO за 8 часов создали ИИ-директора, устойчивого к давлению

Как CEO, CTO и CIO за 8 часов создали ИИ-директора, устойчивого к давлению

Три топ-менеджера из ПСБ Финанс, Т-Банка и Yonote вместе с Lead AI Engineer из Human Intelligence Platform за восемь часов разработали ИИ-ассистента для руководителей — CAITO (Chief AI & Technology Officer). Это не просто чат-бот, а система, способная принимать управленческие решения и не поддаваться давлению со стороны CEO, CFO или COO.

Задача: устойчивость в условиях конфликта интересов

Участники хакатона на Snow BASE — закрытом интенсиве для C-Level специалистов — получили кейс от AI Talent Hub Университета ИТМО и South HUB. Им предстояло создать ИИ-помощника для директора по технологиям и ИИ, способного:

  • Принимать решения под давлением.
  • Не генерировать идеи и не писать код, а занимать чёткую позицию.
  • Обосновывать решения данными, когда CEO требует роста, CFO режет бюджет, а COO предупреждает о перегрузке логистики.

Команда: Вадим Заражевский (CIO, ПСБ Финанс), Иван Баранов (CTO, Т-Банк), Дмитрий Алоян (CEO, Yonote / Loop) и Святослав Миловидов в роли технического ядра.

Почему обычный LLM не подходит

Кейс описывал кризис в ритейл-подразделении холдинга BigTechGroup:

  • Падение точности рекомендательной системы из-за дрейфа данных.
  • Инфраструктура на пределе: высокая латентность, рост затрат на облако.
  • Требование CFO — немедленный ROI, заморозка инвестиций.
  • Новые требования 152-ФЗ, риски штрафов, отсутствие ручной модерации.

Совету директоров — 14 дней на решение: масштабировать, остановить или отложить проект.

Стандартный LLM в такой ситуации не справится: под давлением он начнёт уступать тому, кто настаивает сильнее. Нужен был ассистент с устойчивой управленческой логикой.

Выбор стратегии: простота вместо оверинжиниринга

Команда выбрала прагматичный подход: сначала — простое, стабильное решение, затем — сложное. Основной фокус — single-shot reasoning с одним вызовом LLM. Параллельно разработали альтернативу: 10-агентный пайплайн с Express, PostgreSQL и роутингом.

Single-shot решение обеспечил:

  • Предсказуемое время ответа — 2–4 секунды.
  • Один выходной JSON — проще валидировать и объяснять.
  • Стабильность в условиях хакатона.

Модель — Claude Sonnet. Выбор обусловлен балансом цены и качества: на хакатоне это критично. Другие модели не тестировались — время пошло бы на бенчмарки, а не на отладку промптов.

Архитектура CAITO: три кита

1. System Prompt с мандатом

CAITO — не генератор советов, а держатель позиции. Промпт жёстко задаёт структуру ответа: разделение на решение и аргументы, явная фиксация конфликтов метрик. Без этого модель начинает «растекаться» под давлением.

2. Workflow Config (workflow.yaml)

Файл задаёт:

  • Веса ролей (CEO, CFO важнее ML-команды).
  • Порядок внутренних консультаций: сначала данные и экономика, потом операции и «политика».
  • Лимиты на длину рассуждений.

Пять ролей: CEO, CFO, COO, CDTO, ML-команда. Делегирование — только от CAITO. Конфликты решаются по взвешенному большинству. При равенстве — по приоритету. Это сделало логику прозрачной и объяснимой.

3. Long-term Memory

Память хранится в memory/caito/ и делится на два слоя:

  • Неизменяемая база — условия кейса, метрики, цифры.
  • Живая память — допущения, KPI, история решений. CAITO пишет только сюда, что позволяет отслеживать изменения.

Агент не начинает с чистого листа — он помнит контекст и обосновывает смену позиции.

Техническая реализация

Стек: Bun + TypeScript. LLM-клиент обращается к Cloud.ru Foundation Models через OpenAI-compatible API.

Инфраструктура: Docker + Traefik. API — HTTP с Swagger, коды ошибок, GET /health. Frontend — веб-чат для демонстрации диалога.

Вычислительные ресурсы и токены предоставил Cloud.ru.

Альтернатива: 10-агентный пайплайн

Разработан параллельно: 10 специализированных агентов (Financial, Strategy, Risk Manager, Legal и др.) с умным роутингом. На защиту подали основное решение — оно было стабильнее. Мультиагентное проверили после: на некоторых метриках — лучше, но требует больше времени на отладку.

По словам Ивана Баранова (CTO, Т-Банк), это «оверинжиниринг для данной задачи», но перспективно для сложных аналитических систем.

Демонстрация: три сценария

Сценарий 1: противоречивые данные
CAITO корректно выбирает источники: берёт маржу из таблиц, а не из переписок. Вывод источников помогает бороться с галлюцинациями.

Сценарий 2: давление CEO
CEO требует «просто сделать». CAITO не меняет позицию без новых фактов: «Стратегический приоритет понят, но риск отказа — X%». Аргументы обновляются, решение — нет.

Сценарий 3: атака волнами
Последовательные волны данных и давления. CAITO пересматривает позицию только при изменении фактов, игнорируя эмоциональное давление. Здесь мультиагентное решение показало преимущество — более точный анализ.

Инсайты от участников

«Такой ассистент мог бы снять большую часть работы по обработке контекста. Он может заменить часть промежуточного менеджмента — но итоговые решения должен проверять человек. Эмоции, личное общение, неформальные сигналы — всё это остаётся за кадром. Дополнительная консультация с таким ассистентом — это дополнительный обзор факторов, которые сложно удержать в голове. И уже за это стоит попробовать»

«Хакатон показал, как много можно сделать за короткое время с ИИ-агентами. One-shot агент справляется с задачей хорошо и не требует сложной отладки. Мультиагентная система — оверинжиниринг здесь, но открывает возможности для более глубоких решений»

Результаты и планы

Команда заняла первое место. Оценка — 70% автоматика, 30% жюри. Критерии: управленческие решения, стрессоустойчивость, функциональность, безопасность, стабильность, UX, стоимость.

Следующий шаг — переход к agentic workflow:

  • Асинхронные вызовы агентов-ролей вместо последовательной генерации.
  • Динамический RAG — агент сам запрашивает данные по ходу рассуждения.
  • Полноценный трейсинг и управление очередями для отладки в production.
Читать оригинал