Три месяца назад, в феврале, я написалкомментарий, что LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод. Некоторые коллеги эту идею поддержали, некоторые наоборот - раскритиковали. Это нормально, у нас у всех свой собственный опыт, которым и форматируется наше мышление.
Мой опыт говорит мне о том, что агентов можно выстроить в цепочку, подать на вход задачу (issue) и на выходе иметь готовый результат - код. Или отказ в обработке и причину отказа - тоже себе результат. Ведь именно такую цепочку я и сделал. Цепочку, которая автоматически, без моего участия, превращает запрос любого github-пользователя в страницу моего сайта. Или не превращает, если не посчитает нужным. Теперь любой github-пользователь может не просто критиковать мой февральский коммент, а критиковать предметно - на деле показать, что агенты действительно не могут справляться с возложенной на них задачей. Или убедиться на практике, что могут.
Это простое веб-приложение, которое регистрирует события github-репо через веб-хуки и поднимает по определённым событиями докер-контейнер с агентом внутри. Агент анализирует входящие данные, принимает решение, изменяет код и выкатывает результат на прод через GitHub Actions. На самом деле там 8 разных профилей для Codex-агента - 8 разных стартовых промптов, 8 разных ролей. Их поочерёдное применение и позволяет тикету пользователя превращаться в страницу моего сайта.
Это не production ready решение совершенно. Я сделал этот конвейер прежде всего для самого себя. Конвейер позволяет настроить запуск агентов только на определённых пользователей github'а. У меня уже настроено несколько таких конвейеров на разных репозиториях. Новот этот конвейеря настроил без ограничения по автору тикета. Любой может запостить issue и посмотреть на результат работы - что сделал агент, дошёл ли он до публикации страницы, на каком этапе "срезался". Особо любопытные могут даже попытаться ломануть окружение, в котором работает агент, или заставить его сделать какое-нибудь безобразие на внешних ресурсах. Всё, что удерживает агента в рамках - это стартовые промпты. Я уверен, что есть способы заставить агентов выполнять нелегитимные действия, но я также уверен, что есть способы ограничить возможности агентов выполнять нелегитимные действия. В любом случае, ответственность за применение инструмента не на производителе инструмента, а на его пользователе. Просто помните об этом.
Я приглашаю всех энтузиастов и скептиков самим попробовать этот конвейер в работе. Проверить свои ожидания и опасения. Ну а я взамен получаю опыт эксплуатации продукта в "естественной среде обитания" :)
Сделать тикет -https://github.com/flancer32/site-teqfw/issues
Посмотреть результат -https://teqfw.com/demo/pages/
Да, агент, который производит обработку - это Codex с моделью gpt-5.4-mini на самом низком уровне reasoning'а. Самый дешёвый тариф. Поэтому чудес "разумного поведения" не будет. Но лично для меня главное в этом эксперименте - предсказуемость. Будет ли конвейер работать так, как я предполагаю, или пытливые умы экспериментаторов, ежели таковые будут, смогут меня озадачить.