Мой фреймворк для агентной разработки с Claude Code

Год назад я увлёкся идеей вайбкодинга и начал искать способ создавать полезные продукты с помощью ИИ.

Сначала пробовал использовать Cursor и генерировать код одним запросом. Результаты были плачевными — ничего не работало. Тогда я попробовал подробно описать, как должен выглядеть сервис, как он должен вести себя при нажатии на кнопки, и даже нарисовал интерфейс в Figma. Агент что-то сделал, но с множеством багов.

Я изучил опыт других разработчиков и понял: ваншот-подход не работает. У агента недостаточно контекста и когнитивных ресурсов, чтобы с нуля написать даже простое расширение для браузера. Задачи нужно разбивать на мелкие шаги.

Я стал работать по-другому: открывал новый чат, ставил одну задачу, проверял результат, закрывал чат. Повторял процесс. Так я создал своё первое расширение — оно ищет битые ссылки на сайтах. Спустя девять месяцев у него 2500 пользователей (половина — из Индии) и 16 положительных отзывов. Приятно, но мало. Нужно было двигаться дальше.

За последние полгода я реализовал около десяти небольших проектов. Некоторые — для себя: например, автоматический репост из Telegram в блог и агент, управляющий календарём. Другие — для команды: RAG-агент, отвечающий на вопросы по базе знаний. Пару проектов удалось монетизировать: один бот уже имеет 33 тысячи пользователей и приносит около $1000 в месяц.

Всё это я делал в Claude Code. С каждым проектом я лучше понимал, как устроена агентная разработка, как общаться с ИИ, чтобы он меньше галлюцинировал. Я создавал новые скиллы, дорабатывал старые, добавлял агентов-ревьюверов для поиска багов и уязвимостей.

В итоге я собрал собственный фреймворк для агентной разработки и выложил его на GitHub. Это набор скиллов и команд для Claude Code, которые помогают ИИ вести себя как настоящий разработчик.

За два месяца проект набрал 100 звёзд. Я получил несколько отзывов, что с этим фреймворком действительно проще и быстрее создавать небольшие продукты. Хочу поделиться им и с вами.

В чём суть фреймворка

Я не разработчик. Учился программированию в школе и университете, но никогда не писал код в реальных проектах. Моя карьера началась в маркетинге, потом я перешёл в менеджмент.

Фреймворк создан для таких же людей — с техническим складом ума, но без опыта реальной разработки. Настоящий разработчик здесь — Claude Code. Он же DevOps, он же специалист по безопасности, он же технический писатель.

Человек выполняет роль продакта: придумывает идею, описывает поведение системы в разных сценариях и edge cases, ставит задачи, понимает потребности пользователей. А ещё — тестирует результат, чтобы убедиться, что всё работает как задумано.

Работа идёт поэтапно: сначала планирование, потом декомпозиция задач, затем реализация. На каждом этапе у агента есть скилл с инструкцией, как действовать, и несколько субагентов-ревьюверов, которые проверяют качество и решают, можно ли переходить дальше.

Процесс начинается с user-spec — документа, написанного простым человеческим языком. Он описывает, что мы делаем, зачем и как система должна себя вести.

Я говорю агенту, что хочу создать. Он запускает режим интервью и задаёт десятки вопросов:

  • Что должно произойти, если пользователь сделает то-то?
  • Что делать, если API не отвечает?
  • Есть два варианта реализации — простой и надёжный. Какой выбрать?

Параллельно агент изучает кодовую базу, документацию, ищет информацию в интернете. На выходе — подробный документ, который я могу прочитать, понять и доработать.

Когда user-spec готов, я прошу агента создать tech-spec. Там описывается, какие функции писать, какие файлы менять, как тестировать.

Агент анализирует user-spec, изучает код и документацию, создаёт технический план, проходит несколько этапов ревью и правок. Объём — в среднем 300–400 строк.

Затем другой агент разбивает tech-spec на атомарные задачи. В каждой указано:

  • Что нужно сделать.
  • Какие файлы изменить.
  • Какую документацию изучить.
  • Какие тесты написать.
  • Какие скиллы использовать.
  • Критерии приёмки.

Например, если задача — написать промт для LLM, вызываемого через API, её выполняет агент со скиллом prompt-master. Если нужно писать код — code-writer и так далее.

Каждая задача проверяется ревьюверами: на адекватность решения, уязвимости, соответствие user-spec и tech-spec.

На этом этапе я уже не участвую. Я утвердил user-spec — дальше вся ответственность на агентах.

Сама разработка

Когда задачи готовы, начинается реализация.

Вся работа ведётся по TDD: сначала пишутся тесты, потом — код. Если делать наоборот, агент начинает подгонять тесты под уже написанный код, включая ошибки.

Есть два режима: do-task и do-feature.

В режиме do-task агент берёт одну задачу, загружает нужные скиллы, реализует, проверяет себя по критериям приёмки, запускает тесты, затем вызывает ревьюверов — по коду и безопасности. После успешного завершения я закрываю чат и запускаю следующую задачу в новом чате.

Режим do-feature — это ваншот-подход. С февраля в Claude Code появились Agent Team: тимлид создаёт команду агентов и координирует их работу.

Тимлид определяет, какие задачи из tech-spec ещё не выполнены, запускает на каждую отдельного агента-разработчика. После выполнения — запускает ревьюверов и финальное QA всей фичи.

Для простых задач это работает хорошо: можно запустить команду агентов и уйти. Один раз они кодили 8 часов без вмешательства — и всё заработало. Но для сложных проектов, особенно с живыми пользователями и монетизацией, я предпочитаю делать задачи по одной и вручную проверять результат.

Документация проекта

Чтобы агенты не теряли контекст при создании нового чата, я веду project knowledge — документ по каждому проекту. Там описано:

  • Цель проекта.
  • Технологический стек.
  • Архитектура.
  • Процесс деплоя.

В начале проекта первая версия документации создаётся на основе интервью. После каждой реализованной фичи я ввожу команду /done — и агент анализирует коммиты и логи разработчиков, обновляя документацию.

Если нужно быстро что-то сделать без спеков, я просто прошу агента изучить project knowledge — и дальше мы можем эффективно взаимодействовать.

Скиллы по созданию скиллов

Все скиллы и ревьюверов я создаю с помощью двух специальных скиллов: skill-master и skill-tester.

skill-master — это инструкция, как писать качественные скиллы и создавать для них ревьюверов.

skill-tester берёт готовый скилл, генерирует для него тестовые задачи, запускает агента и оценивает результат. Обратную связь я передаю skill-master, и он корректирует инструкции.

После этого я дополнительно тестирую скилл на реальных задачах.

Как установить

Самый простой способ — дать ссылку на GitHub вашему Claude Code и попросить установить. Так делают большинство.

Если хотите вручную — скопируйте все файлы в папку ~/.claude. Если у вас нет скиллов с такими же именами, всё скопируется без конфликтов. Если есть — потребуется переименование.

Читать оригинал