Компания Anthropic запустила так называемый режим авто (auto mode) для своего инструмента Клод Код (Claude Code) — функции, которая позволяет искусственному интеллекту принимать решения на уровне прав пользователя. Новый режим призван стать золотой серединой между постоянным контролем со стороны человека и полной автономией, которая может быть опасной.
Баланс между свободой и безопасностью
Клод Код способен действовать самостоятельно: писать код, управлять файлами и взаимодействовать с приложениями. Но такая свобода чревата рисками — например, случайным удалением данных, отправкой конфиденциальной информации или выполнением вредоносных команд, спрятанных в тексте (так называемые инъекции промптов).
Режим авто решает эту проблему: перед выполнением потенциально опасных действий ИИ сначала останавливается, анализирует запрос и предлагает пользователю подтвердить или отклонить операцию.
Как это работает
- Агент Клод Код определяет, что действие может быть рискованным — например, изменение системных файлов.
- Он приостанавливает выполнение и уведомляет пользователя.
- Пользователь решает, разрешить ли операцию, отклонить её или запросить пояснение.
Это компромисс между полным контролем и полной автономией, — говорят в Anthropic. — Мы хотим, чтобы пользователи могли доверять агенту, не жертвуя безопасностью.