Последние несколько лет я плотно общаюсь с разными стартапами — от EdTech до SaaS-проектов в России и за рубежом. Один из них — проект Данила Щербакова, который вместе с командой разрабатывает ИИ-агентов для телефонных звонков в бизнесе. Когда я впервые услышал записи их разговоров, у меня осталось только одно чувство: «Нифига себе». Обычно я сразу сбрасываю звонок, если понимаю, что разговариваю с роботом. Но здесь всё иначе. В этой статье — как устроены такие звонки и как ИИ делает миллион вызовов в месяц.
Как отличить ИИ-агента от старого робота: история про рододендрон
Большинство автоматизированных звонков легко распознать: длинные паузы, повторы вопросов, если ответ не вписывается в сценарий. Причина — использование систем на основе интентов. Их диалоги жёстко прописаны: «Здравствуйте, Максим! Вы интересовались славянским шкафом?» — и если вы говорите, что искали скандинавский, робот теряется и начинает сначала.
ИИ-агенты из проекта работают иначе. Они используют контекст компании и цель звонка, поддерживают диалог, анализируют вопросы и дают осмысленные ответы. В России ежегодно совершается более 50 миллионов бизнес-звонков — и многие хотят автоматизировать этот процесс без потери качества.
«Меня удивило, когда робот работал с питомником растений. На связи была девушка, которая отказывалась от покупки: мол, рододендрон сажают ближе к лету. Робот ответил, что посадка как раз начинается осенью. Диалог выглядел так:
Человек: А сейчас не поздно сажать фруктовые деревья?
Робот: Нет, не поздно. Осень — хороший период. Они успеют укорениться до зимы. Могу подготовить подборку растений, которые сейчас можно высаживать. Удобно, если отправлю в мессенджер?
Человек: Да, меня знаете, я бы хотела грушу большую. Летнюю. Есть у вас такие деревья?
Робот: Да, есть и летние, и зимние. Подготовлю информацию и отправлю.
Человек: Отправьте, пожалуйста, и чтобы дерево было с закрытой корневой системой».
Такой уровень консультации сложно представить от обычного робота или даже среднего продавца.
Живые колл-центры тоже не идеальны. Хороший результат появляется только через 2–3 месяца обучения. В недвижимости продавец начинает показывать результат после 1000 звонков. Чтобы улучшить показатели, нужно нанимать ещё 50 человек — и ждать, пока они обучатся.
Кроме того, «звонарей» сложно контролировать. Они ошибаются, болеют, устают и уходят в отпуск. ИИ-агент же может сделать 100 000 звонков за день. Разговоры длятся 5–7 минут, и люди часто спрашивают: «Вы человек или робот?» Ответ зависит от промта, но почти никто не прерывает общение после того, как узнаёт, что звонит ИИ.
На рынке много дешёвых решений за 1–2 рубля в минуту. Они маскируются под ИИ, но на деле — те же старые роботы на интентах, просто чуть лучше следующие скрипту. Качество разговора от этого не растёт. Настоящие качественные звонки стоят дороже.
Пример из недвижимости:
Человек: Добрый день! У меня в Питере ипотека, но квартира там стоит. Можно ли перекинуть её на другую и доплатить?
Робот: Да, это возможно — называется ипотечный переход. Лучше с вами свяжется специалист. Передам ваши контакты для консультации.
Архитектура внутри: как ребята собрали свой стек и достигли задержки 0,3 секунды
Команда создала собственный технологический стек. Каждый компонент работает на отдельной инфраструктуре, а уникальная система оркестрации координирует всё. Благодаря этому задержка ответа — менее 0,3 секунды. Это быстрее, чем у большинства людей. Голоса звучат естественно, диалоги строятся на fine-tuned языковых моделях.
Что такое fine-tuned модель? Обычная LLM — как студент-троечник: что-то слышал про ваш бизнес, но не разбирается в деталях. Модель из проекта — как опытный менеджер: знает скрипты, FAQ, историю диалогов и понимает, когда можно пошутить, а когда — строго следовать правилам.
Сравнение:
- Базовая LLM: отвечает «по средним по больнице», плавает в терминах, не держит тон, игнорирует правила.
- Fine-tuned модель: говорит на языке вашей аудитории, соблюдает скрипты, стабильно держит сценарий, не выходит за рамки.
ИИ-телефонный агент — модульная система:
- Распознавание речи (STT): голос собеседника превращается в текст в реальном времени.
- Анализ текста в LLM и диалоговой логике: fine-tuned модель, обученная на сотнях миллионов бизнес-разговоров, анализирует смысл, определяет намерения и выбирает ответ. Система отслеживает контекст, ветвления и корректно обрабатывает возражения.
- Синтез речи (TTS): генерируется естественный голос. Задержка между вопросом и ответом — менее 0,3 секунды, чтобы разговор воспринимался как живой. Параллельно оркестратор интегрируется с CRM, фиксируя историю контакта, статус лида и метрики.
«Обычная LLM работает по вероятностям и не обязана следовать бизнес-логике. А в продажах важно пройти этапы квалификации, задать обязательные вопросы и привести диалог к целевому действию».
Поэтому поверх ИИ работает диалоговый движок с жёсткими правилами. Он контролирует структуру разговора, не даёт отклоняться от сценария и гарантирует, что каждый звонок проходит по нужной логике — независимо от формулировок собеседника. Создание такого инструмента обычно занимает годы.
Пример диалога в недвижимости:
Робот: Где хотите купить квартиру и какую?
Человек: Двушку в Воронеже, в ипотеку.
Робот: Двухкомнатная квартира в Воронеже стоит от 6 миллионов. Рассматриваете варианты дороже?
Человек: Нет.
Робот: Тогда менеджеры найдут подходящие варианты и свяжутся с вами в течение дня.
Рынок: важно, чтобы звонили быстро и без пауз
Запуск ИИ-агентов занимает 2–3 дня: 2 дня на сбор данных, 1 день — настройка агента и интеграция с CRM. После тестирования начинается обзвон. Постоянно проводится оптимизация на основе данных.
Всё работает на облачной платформе. Дополнительная разработка не нужна. Управление — через личный кабинет: сбор статистики, аналитика, настройка сценариев, интеграция с CRM и базами данных, A/B-тестирование гипотез. Решение масштабируется до миллиона звонков в день без потери качества.
«Представьте, что несколько подрядчиков одновременно получают доступ к одним и тем же контактам. По каждому номеру звонят 3–5 компаний. Конкуренты обзванивают базу весь день, а этот сервис обрабатывает её за 9–10 минут. Пока другие только начинают, вы уже квалифицировали всех и передали горячие лиды в отдел продаж. В современных реалиях скорость реакции решает: кто получит клиента, а кто услышит: „Спасибо, мы уже заказали у другой компании“».
Цифры с полей: что меняют ИИ-агенты в реальном бизнесе
Эффективность ИИ-агентов подтверждают не обещания, а реальные метрики.
Рост конверсии в лида:
- В холодных звонках для застройщика конверсия в квалифицированного лида выросла на 50%. Тысяча звонков приносит в полтора раза больше готовых к сделке клиентов.
- В обработке входящих заявок для клининга конверсия выросла с 48% до 59% (+11 п.п.). Это +11 клиентов с каждой сотни обращений без увеличения бюджета.
Экономическая эффективность:
- Снижение затрат на 60%. Исчезли расходы на текучку, обучение и почасовую оплату операторов.
- ROI 21:1. В кейсе с клинингом каждый вложенный рубль принёс 21 рубль чистой прибыли.
Скорость и объём:
- Время реакции на входящую заявку сократилось с 1,5 часов до 3 секунд — в 1800 раз быстрее. Звонок приходит, пока клиент не закрыл вкладку.
- Миллион звонков в месяц. Переход с 5000 до 20 000 звонков в день занимает не месяцы найма, а пару дней настройки мощностей.
Стабильность и управляемость:
- Исчез «человеческий фактор». Конверсия больше не падает из-за усталости менеджеров к пятнице или после праздников. ИИ работает 24/7 с одинаково высоким качеством.
- Тотальный контроль. В живом колл-центре прослушивают 1% разговоров. Здесь анализируется каждый диалог, а гипотезы тестируются A/B-тестами за день.
ИИ-агенты превращают звонки из статьи расходов в предсказуемый канал привлечения. Высокая скорость и строгое следование скрипту позволяют получить клиента раньше конкурентов.
Будущее ИИ-звонков
Такие технологии — это будущее коммуникаций между бизнесом и клиентами. Пока ИИ закрывает первую линию, а люди превращают лиды в покупателей. Здесь человек пока не заменим.
Будущее — за экосистемой коммуникаций. Каждый бизнес хочет быть на связи 24/7. ИИ-роботы помогут: клиент может позвонить в 2 ночи, а робот не просто примет звонок, но и проведёт консультацию. У него будет бодрый голос, качественные ответы и умение приближать сделку.
«Недавно был случай: ИИ-робот в ЖКХ начал материться. У этих агентов такого не случится — настройки блокируют посторонние обучающие каналы. Грубость исключена. При этом ИИ умеет распознавать негатив и троллинг. В таких случаях он просто прекращает разговор».
Кстати, в разговорах с ИИ-агентами бывают забавные моменты. Люди спрашивают, человек ли с ними говорит, а иногда даже зовут звонаря на свидание.