LLM под капотом. Модель выдумала телефон доверия — чиним архитектурой, не промптом

LLM под капотом. Модель выдумала телефон доверия — чиним архитектурой, не промптом

Модель LLM может выдумать номер телефона доверия, если она одновременно анализирует входные данные и формирует финальный ответ. Это проблема архитектуры, а не промптинга.

Ловушка одного прохода

Типичная архитектура LLM-продукта: пользовательский ввод поступает в модель, выход модели уходит пользователю. Если нужно одновременно проанализировать входные данные и выдать результат в определённом голосе, тоне или формате, обе задачи кладутся в один промпт.

Паттерн: Triage-and-Voice

Решение архитектурное: разделить работу с LLM на два прохода, с бэкендом как слоем принятия решений между ними.

Почему это работает: три свойства

Разделение ответственности. Кешируемый анализ. Безопасность через backend gate.

Где применим Triage-and-Voice

Это паттерн не только для чат-ботов. Это архитектурный паттерн LLM-продуктов.

Принцип: модель ставит флаг, код принимает решение, модель говорит.

Неудобная правда о наивной архитектуре LLM-продуктов

Если ваш LLM-продукт делает один вызов, в котором модель одновременно рассуждает о входных данных и формирует финальный ответ, вы выполняете анализ и презентацию как одну атомарную операцию без чекпоинта между ними.

Triage-and-Voice — это не про добавление сложности. Это про добавление точки контроля между тем, что модель думает, и тем, что получает пользователь.

Читать оригинал