Next Best Action: от задолженности к прибыли через персонализацию коммуникаций

Next Best Action: от задолженности к прибыли через персонализацию коммуникаций

На связи — Ольга Кравченко, технический директор по разработке моделей в Газпромбанке. Сегодня я расскажу, как наша команда создала инструмент, который помогает переходить от просроченной задолженности к прибыли за счёт персонализации коммуникаций.

В нашей команде 11 человек: дата-сайентисты, дата-инженеры и специалисты по автоматизации. Мы отвечаем за блок взыскания — всё, что связано с просрочками, должниками, колл-центром и возвратом средств.

Зачем банку взыскание

Для стабильной работы банка недостаточно только выдавать кредиты или привлекать клиентов. Важно сопровождать кредиты на всех этапах, особенно когда возникает задолженность.

Это важно в краткосрочной перспективе:

  • Снижение резервов — меньше средств нужно замораживать на потенциальные убытки.
  • Экономия ресурсов — меньше затрат на суды, коллекторов и работу колл-центра.
  • Возврат средств — банк получает часть долга сразу или через реструктуризацию.
  • Улучшение показателей — растёт качество кредитного портфеля, снижается нагрузка на капитал.

А в долгосрочной:

  • Сохранение репутации — в глазах клиентов, партнёров и регуляторов.
  • Поддержание лояльности — персонализированные коммуникации помогают клиентам оставаться и возвращаться.
  • Развитие инструментов помощи — рефинансирование, реструктуризация и другие решения.
  • Основа для прибыльных операций — успешные кейсы можно масштабировать.

Но есть проблема: сложно одновременно сделать процесс дешёвым, быстрым и качественным.

Мы выделили семь ключевых условий эффективного взыскания:

  1. Доля урегулирования — важно начинать коммуникацию быстро: время — деньги.
  2. Объём урегулирования — количество клиентов, которые «выздоровеют» и выйдут из просрочки.
  3. Лояльность клиентов — коммуникации должны быть персонализированными.
  4. Нагрузка на колл-центр — сотрудников мало, а задач много.
  5. Затраты на коммуникации — меньше СМС и звонков — лучше.
  6. Стоимость решения — желательно обойтись без дополнительного ПО и инфраструктуры.
  7. Дополнительные ресурсы — нам ничего не нужно, у нас всё в порядке 🙂

Мы разделили задачи на две части: архитектуру (быстро, дёшево, своими силами) и моделирование (эффективно, оптимально, без потери лояльности).

Архитектура: как ускорить доступ к данным

Данные в банке хранятся и обрабатываются на платформе данных — комплексе систем для хранения и анализа информации.

Она включает:

  • Источники данных — внутренние и внешние, поступают пакетно или потоково.
  • Операционное хранилище — хранит реплики исходных систем в исходном формате.
  • Корпоративное хранилище данных (КХД) — двухслойная DWH-система:
    • Stage — детальные данные по источникам.
    • Core — консолидированные данные без дублей.
  • Витрины данных — преобразованные данные для аналитики и потребителей.
  • Фабрика данных — на базе Hadoop, для обработки больших объёмов, включая неструктурированные.
  • Лаборатория данных — реплика основного кластера, используется как песочница.

После очистки и преобразования данные используются в онлайн- и офлайн-ML-пайплайнах. Модели запускаются в контейнерах, их жизненный цикл управляется через систему СУМО.

Ключевая проблема — задержка в получении данных. Из-за длительных процессов лаг между возникновением просрочки и реакцией достигал трёх дней.

Чтобы это исправить, мы подключились к системе Collection — основной бизнес-системе взыскания. В ней есть автоматические процессы, включая уведомления о просрочках.

Используя ETL Framework, мы «повесили» тег на момент запуска этого процесса, не создавая дополнительной нагрузки. Так мы получили данные о просрочке сразу после её возникновения.

Моделирование: от сегментации к Next Best Action

Раньше мы использовали сегментацию клиентов по матрице Balance at Risk (BaR): Low, Medium, High — в зависимости от суммы долга и риска. Коммуникации шли по шаблону: пуш, СМС, звонок робота и так далее.

Теперь мы перешли к подходу Next Best Action — прямой рекомендации канала коммуникации. Для первых дней просрочки — First Best Action, затем следующие по эффективности, пока клиент не выйдет из дефолта (90 дней).

Но персонализация — не всё. Нужно учитывать нагрузку на колл-центр и бюджет на коммуникации.

Маркетинговые инструменты в взыскании

Мы решили применить в взыскании подходы из маркетинга. Клиенты делятся на четыре типа:

  1. «Не беспокоить» — негативно реагируют на любые контакты.
  2. Лояльные — платят независимо от коммуникаций.
  3. Потерянные — не платят ни при каких условиях.
  4. Убеждаемые — платят, только если с ними связаться. Это наша целевая аудитория.

Мы выбрали Uplift-модели — они ищут именно таких клиентов, оценивая чистый эффект от коммуникации.

Этапы реализации

Реализация включала:

  • Архитектуру пилота.
  • Выбор метрик.
  • Выбор и настройку алгоритмов.
  • Вывод в промышленную эксплуатацию.

Мы разделили трафик: 30% — пилот, остальные — контрольные группы (старая стратегия и случайные взаимодействия).

Метрики оценки:

  • Доля урегулирования — через метрику Gini.
  • Объём урегулирований — через BaR-матрицу.
  • Затраты на коммуникации — Uplift на топ-30%.
  • Лояльность — метрика Qini (показывает, не раздражаем ли клиентов).
  • Стоимость решения — Time To Market.
  • Удовлетворённость заказчика — улыбка 🙂

Какие модели мы рассмотрели

Подходы к Uplift-моделированию:

  1. Одна модель (Solo) с флагом коммуникации, с пересечением признаков или трансформацией классов.
  2. Две модели — независимые, зависимые или перекрёстно зависимые.
  3. Множественный класс/тритмент — для нескольких каналов воздействия одновременно.

Мы не выбрали один подход, а создали оптимизатор. Он:

  • Обучает все модели на данных с определённого этапа просрочки.
  • Находит лучшие по метрикам Gini, BaR, с учётом ограничений на колл-центр и бюджет.
  • Формирует топ моделей для каждого этапа.

Для контроля качества — три дополнительные модели на всей выборке и по одной на каждую группу.

Результаты

Данные накапливались с конца 2024 года. Результаты уже видны:

  • Time to market — 6 месяцев (в пределах стандартного цикла).
  • Доля урегулирования — на 25% выше, чем у старой стратегии. Прирост прибыли — от 15 до 32% по каналам.
  • Gini — выросла.
  • Нагрузка на колл-центр — снизилась на 73%: операторы звонят только тем, кто отреагирует.
  • Затраты на коммуникации — минус 10% на клиента.
  • Лояльность — рост: +5% к ответам оператора, +11% — к роботу.

Финансовый эффект: более 3 млрд рублей сохранённых балансов на каждые 20 тысяч договоров — только за месяц и только по First Best Action.

Оценка от бизнеса — выше всяких ожиданий. А наша главная награда — довольный заказчик: «Всё хорошо, ты молодец!» 🙂

Читать оригинал