У Claude Code от Anthropic появился «безопасный» режим автономной работы

Компания Anthropic запустила так называемый режим авто (auto mode) для своего инструмента Клод Код (Claude Code) — функции, которая позволяет искусственному интеллекту принимать решения на уровне прав пользователя. Новый режим призван стать золотой серединой между постоянным контролем со стороны человека и полной автономией, которая может быть опасной.

Баланс между свободой и безопасностью

Клод Код способен действовать самостоятельно: писать код, управлять файлами и взаимодействовать с приложениями. Но такая свобода чревата рисками — например, случайным удалением данных, отправкой конфиденциальной информации или выполнением вредоносных команд, спрятанных в тексте (так называемые инъекции промптов).

Режим авто решает эту проблему: перед выполнением потенциально опасных действий ИИ сначала останавливается, анализирует запрос и предлагает пользователю подтвердить или отклонить операцию.

Как это работает

  • Агент Клод Код определяет, что действие может быть рискованным — например, изменение системных файлов.
  • Он приостанавливает выполнение и уведомляет пользователя.
  • Пользователь решает, разрешить ли операцию, отклонить её или запросить пояснение.

Это компромисс между полным контролем и полной автономией, — говорят в Anthropic. — Мы хотим, чтобы пользователи могли доверять агенту, не жертвуя безопасностью.

Читать оригинал