Самосовершенствование или самозаражение? Тонкая грань, на которой стоит весь прогресс ИИ

Самосовершенствование или самозаражение? Тонкая грань, на которой стоит весь прогресс ИИ

Рекурсивное самосовершенствование — или RSI — это способность ИИ-системы итеративно улучшать себя: предлагать изменения, тестировать их, оценивать результат и сохранять удачные модификации, создавая новую версию себя. Для обычного читателя это можно выразить просто: машина, которая не просто решает задачи, а учится решать их всё лучше.

Для экспертов определение должно быть строже. Недостаточно, чтобы модель использовала инструменты или писала код. Важен эндогенный, измеримый и относительно автономный цикл оптимизации, в котором система напрямую участвует в улучшении собственных компонентов — архитектуры, обвязки или даже процесса обучения. Именно здесь проходит граница между громким заголовком и настоящим прорывом.

Почему этот спор — не пустой звук

Сейчас активно обсуждается, насколько реалистична идея самовосстанавливающегося ИИ. RSI стал одной из главных тем — не только потому, что обещает использовать ИИ для улучшения ИИ, но и потому, что за этим может скрываться сдвиг в инновациях: прогресс базовых моделей замедляется, а фокус переходит на надстройки — агенты, инструменты, экспериментальные циклы. Разница принципиальна.

Фраза «ИИ улучшает сам себя» звучит мощно. Но она не то же самое, что «ИИ помогает оптимизировать социотехническую систему, в которой он работает». Это разные уровни реальности.

Не фантазия, а репозиторий на GitHub

Самый показательный пример — не футуристический сценарий, а проект autoresearch Андрея Карпаты на GitHub. В нём агент получает простую среду для обучения, может менять код, запускать короткие эксперименты, измерять метрики и повторять цикл часами. Никакой магии — и именно поэтому это тревожно.

Суть autoresearch — не в создании сверхразума, а в демонстрации того, что часть исследовательской работы, ранее доступной только людям, теперь можно автоматизировать. Цикл «протестируй — измерь — сохрани или выброси» становится воспроизводимым процессом. Это меняет индустрию: ремесленный труд превращается в масштабируемую инфраструктуру.

Интервью с Карпатой «Конец программирования» важно не провокацией, а концепцией: мы вступаем в эру петель. Ценность теперь не в статичной модели, а в системах, которые наблюдают, действуют, корректируют и повторяют. Разработчики уже говорят, что «работают почти на 90% на естественном языке». Переход от ассистента к автономному агенту — и есть главная новость.

Речь не о том, что ИИ «думает» как человек. Речь о том, что он обладает вычислительным терпением — способностью бесконечно повторять циклы без усталости.

Давайте без хайпа. Хотя бы попробуем

Стоит избегать завышенных ожиданий. Многие современные системы не являются RSI в строгом смысле. Например, в работе 2023 года Self-Taught Optimizer (STOP) описана рекурсивная генерация кода, но базовая модель при этом не менялась. Улучшалась не модель, а система вызовов и оценки результатов.

То есть система может демонстрировать самоусиливающееся поведение, не переписывая свои веса и не вызывая «интеллектуального взрыва», о котором писал И. Дж. Гуд. Но и отмахиваться от таких систем как от «неполноценных» — ошибка. История знает множество революций, начавшихся с частичных решений.

Почему это важно: не философия, а экономика

Значение RSI — не в философских спорах, а в экономике. Когда улучшение зависит от дефицитного человеческого труда, оно медленное, ограниченное бюджетами и бюрократией. Когда оно автоматизировано — ускоряется до скорости вычислений и качества метрик.

METR показал: длина задач, которые агенты могут выполнять автономно с 50%-ной надёжностью, удваивается примерно каждые семь месяцев. Это не значит, что завтра появятся полностью автономные лаборатории. Но граница между инструментом и частичным заменителем сдвигается быстрее, чем готовы признать университеты и компании.

Anthropic отмечает, что агенты уже используются в рискованных областях — пока не массово — и что почти половина активности через их API связана с программной инженерией.

PaperBench от OpenAI, напротив, показывает ограничения: даже лучшие агенты пока не способны воспроизводить передовые научные исследования на уровне докторантов. Но они уже автоматизируют значительную часть рутинной, разведочной работы — ту, что лежит в основе повседневной науки.

Именно эта комбинация — рост автономии и сохранение зависимости от человека — и является ключевым сигналом.

Хрупкость, о которой все забывают

Однако все упускают из виду хрупкость таких систем. Цикл самосовершенствования настолько хорош, насколько хороша его функция оценки и среда обучения. При плохих критериях система будет эффективно оптимизировать мусор.

Ещё опаснее — обучение моделей на данных, сгенерированных другими моделями. Работа, опубликованная в Nature, предупреждает: неразборчивое использование синтетических данных может привести к коллапсу моделей — необратимым дефектам и искажению исходного распределения.

Самосовершенствование не происходит в вакууме. Оно может превратиться в самозаражение.

Настоящий переломный момент

Реальная важность RSI — не в фантазиях о восстающем ИИ. Она в прозаичном, но мощном: в системах, которые автоматизируют рост доли процессов изобретения, тестирования и оптимизации.

Для трансформации экономики знаний не нужен голливудский сценарий. Достаточно, чтобы итеративная, рутинная, проверяемая работа перестала требовать участия людей. И это уже происходит.

Вопрос не в том, реален ли хайп. Вопрос в другом:

Что произойдёт, когда улучшение перестанет быть спорадическим, дорогим и человеческим — и станет непрерывным, автоматизированным и масштабируемым?

Именно это, а не пробуждение сознания, станет настоящим переломным моментом. Потому что машина начнёт делать то, что раньше было прерогативой R&D-отделов: выдвигать гипотезы, проверять их, измерять и учиться — не дожидаясь понедельника.

Читать оригинал