MCP не умер: почему ИИ-агенты тонут в контексте

MCP не умер: почему ИИ-агенты тонут в контексте

Год назад Model Context Protocol (MCP) казался универсальным решением всех проблем. Один протокол — и ИИ-агенты легко интегрируются с GitHub, Slack, Jira и внутренними базами данных. Не нужно писать кастомные плагины: всё работает по единому стандарту. Индустрия поверила в этот подход. К концу 2025 года MCP поддерживали ChatGPT, Cursor, Gemini и VS Code, а число серверов превысило 10 000.

Но в апреле 2026 года наступило пробуждение. MCP не умер, однако подход «подключи всё сразу» провалился. Разработчики обнаружили, что их ИИ-агенты стали работать хуже. Проблема оказалась не в интеграции, а в когнитивной перегрузке. Я разобралась, почему бесконтрольное подключение инструментов через MCP снижает производительность агентов, и какие три архитектурных паттерна пришли ему на смену.

Кризис контекста: когда больше — значит хуже

Первая ошибка, которую допустили почти все команды при внедрении MCP, была самой логичной: если есть способ дать агенту новые возможности, почему бы не дать ему всё сразу?

Разработчики подключали серверы для кода, документации, баг-трекера и аналитики. В результате, ещё до первого запроса пользователя, в контекстное окно агента загружались десятки схем API, описаний функций и параметров.

В некоторых случаях только инициализация инструментов съедала до 55 000 токенов контекста.

Традиционная программа может хранить огромный каталог API без потерь в производительности. Но ИИ-агент работает иначе. Он должен анализировать всё, что находится в его контексте: выбирать нужный инструмент, решать, как его вызвать, и удерживать важные части результата, не теряясь в шуме.

Anthropic в своём руководстве по контекст-инжинирингу прямо заявляет:

"Контекст ограничен и не становится полезнее просто от объёма. Поэтому его лучше строить вокруг минимального набора действительно важных данных, которые нужны для решения задачи."

Проще говоря, ИИ-агент не становится умнее, когда видит все схемы при запуске. Он становится рассеянным. Большое контекстное окно не отменяет необходимости в гигиене инструментов.

Три решения проблемы перегрузки

Индустрия быстро поняла: стандартизация доступа к внешним системам — это только половина дела. Вторая — управление тем, когда и как агент видит эти инструменты. Сейчас в agentic engineering доминируют три подхода.

1. Динамический поиск инструментов (Tool Search)

Вместо загрузки всех схем при старте, агент получает один мета-инструмент — поиск по каталогу возможностей. Получив задачу, он сначала запрашивает у реестра нужные инструменты, загружает их схемы, выполняет действие и выгружает их из контекста. Это резко снижает когнитивную нагрузку, хотя добавляет задержку из-за дополнительных API-вызовов.

2. Agent Skills (Навыки по требованию)

Этот подход появился в конце 2025 года как ответ на разрастание MCP. Agent Skills — это открытый стандарт Anthropic для упаковки навыков агента в отдельные модули. Вместо хранения всех инструментов и инструкций в контексте, агент подгружает нужный навык под конкретную задачу. Это снижает перегрузку и делает поведение агента более предсказуемым.

Например, вместо прямого доступа к API Jira агенту дают навык Создать баг-репорт из логов ошибки. Этот навык содержит только ту логику и промпты, которые нужны для узкой задачи.

  • Загрузка в контекст: Все инструменты сразу — против — только нужный навык по требованию
  • Уровень абстракции: Сырые API-эндпоинты — против — бизнес-логика и готовые воркфлоу
  • Расход токенов: Огромный (вся схема API) — против — минимальный (только описание навыка)
  • Вероятность ошибки: Высокая (агент может запутаться) — против — низкая (жёсткие рамки)

3. CLI-обёртки

Самый прагматичный подход 2026 года. Вместо того чтобы заставлять агента разбираться в сложных JSON-схемах через MCP, разработчики пишут простые CLI-утилиты. Агент вызывает команду в терминале, например: create-ticket --severity high --desc "DB crash". Это почти не расходует токены и работает надёжно, хотя лишает агента возможности исследовать API самостоятельно.

Что в итоге?

MCP жив и остаётся лучшим стандартом для интеграции. Умерла лишь идея, что одной совместимости между системами достаточно для создания надёжного ИИ-агента.

Если вы строите автономные системы в 2026 году, ваш главный вопрос уже не «Сколько инструментов я могу подключить?». Теперь он звучит так: «Какой абсолютный минимум информации нужен модели прямо сейчас, чтобы она не потеряла фокус?».

Автоматизация бизнес-процессов с помощью ИИ-агентов требует не просто умных нейросетей, а умной архитектуры. Контекстное окно — не безлимитный ресурс, а главное узкое место системы. Гигиена контекста — первый навык, который нужно освоить, прежде чем строить что-то серьёзное.

Читать оригинал