Испытываем подход CEO Y Combinator — запускаем ИИ-фабрику работяг на базе Claude Code

На прошлой неделе в сети появилась новость: генеральный директор Y Combinator Гарри Тан с помощью ИИ Claude пишет десятки тысяч строк кода ежедневно и управляет виртуальной командой из 10+ ролей. Я решил проверить, насколько это решение реально работает и не является ли очередным хайпом. В этой статье — разбор инструмента, который использует Тан, и мой практический опыт его внедрения.

«Серебряная пуля» от Гарри Тана

На странице своего проекта Гарри Тан утверждает, что за два месяца написал более 600 000 строк кода, треть из которых — тесты. Это действительно много: для сравнения, в романе Льва Толстого «Война и мир» около 83 000 строк текста.

Автор предлагает всем желающим попробовать свой инструмент — GStack. Он позиционирует его как фабрику для создания ПО, способную превратить Claude Code в команду виртуальных инженеров под вашим контролем. Проект полностью бесплатный и открытый, распространяется по лицензии MIT.

GStack — не просто набор промтов для новичков. Это рабочая лошадка для технологичных предпринимателей, техлидов и стартапов, которым важно строго контролировать качество и планирование на каждом этапе разработки. Подходит всем, кто создаёт продукт в одиночку или в небольшой команде.

Что такое Claude Code?

Для тех, кто не знаком: Claude Code — это ИИ-агент на базе Claude.ai. Он может читать и редактировать код, запускать команды и интегрироваться с инструментами разработки. Позиционируется как многофункциональный помощник для программистов: помогает разрабатывать функции, искать баги и автоматизировать процессы.

Чтобы использовать его продуктивно, нужна подписка Pro — 17 долларов в месяц.

Что такое GStack?

Технически GStack — это набор навыков в формате SKILL.md для Claude Code. Фактически — готовый пакет навыков от Гарри Тана, который можно установить в свой Claude Code и сразу начать использовать.

Что такое SKILL.md?

Сегодня SKILL.md — общепринятый стандарт для создания навыков ИИ. Один файл — один специализированный навык для LLM-агента. Навык создаётся один раз и может использоваться в любом совместимом агенте.

Принцип прост: размещаете файл SKILL.md в нужной папке, и ИИ обращается к нему при выполнении задачи. Это помогает не перегружать контекст и напоминает работу с библиотеками в программировании. В Claude Code навыки хранятся:

  • в домашней директории: ~/.claude/skills/<skill-name>/SKILL.md
  • или внутри проекта: .claude/skills/<skill-name>/SKILL.md

Зачем использовать несколько навыков, а не один?

По словам Гарри Тана, если просить одного ИИ-ассистента выполнять разные задачи, он начинает домысливать ваши ожидания. Например: вы просите «провести ревью пул-реквеста» — и агент гадает: «Проверить ли отступы? Или проанализировать архитектуру?».

Особенно это мешает, когда один агент работает в разных областях: стратегия, код, маркетинг. Поэтому Тан выступает за модульный подход — каждый навык отвечает за свою зону.

Эта философия легла в основу GStack. Каждый навык имеет свой «психотип» и контур ответственности. Слово mode здесь не означает режим — это скорее «стиль мышления» навыка:

  • Planning mode — мыслит стратегически, с фокусом на продукте, пользователях и долгосрочных целях.
  • Engineering mode — думает как системный архитектор: о взаимосвязях, надёжности, метриках. Сопротивляется разрастанию функционала.
  • Review mode — мыслит как параноидальный инженер, который видел падения в продакшене. Ищет ошибки, следит за CI/CD.
  • Shipping mode — действует по чек-листам. Минималистичен, требует чёткого выполнения всех шагов.
  • QA mode — проверяет доступность экранов, работоспособность интерфейсов, наличие актуальных тестов.

Настоящая сила GStack — не в отдельных навыках, а в их комбинации и правильной последовательности. Автор предлагает такую цепочку:

/plan-ceo-review → /plan-eng-review → [Implement] → /review → /ship → /qa

Если это звучит интересно — переходим к установке. В конце статьи расскажу, что удалось собрать с помощью этих навыков за неделю.

Устанавливаем GStack

Для работы понадобится: Claude Code, Git, Bun v1.0+ и Node.js (если у вас Windows).

Самый сложный момент — доступ к Claude Code. Он требует платной подписки Pro (17$ в месяц) и недоступен из России. Придётся использовать VPN с выходом в США или Европу. Также нужен иностранный номер телефона для регистрации — например, казахский или узбекский. Альтернатива — купить готовый аккаунт через посредника. Я выбрал этот вариант — обошлось в 2900 рублей (с подпиской на месяц).

Claude работает на Windows, MacOS и Linux. Можно использовать браузер, отдельное приложение или консоль. Я установил приложение на MacOS и консольную версию — так удобнее при работе в терминале.

Git, скорее всего, уже установлен. Если нет — воспользуйтесь инструкцией по установке.

Зависимости установит сам Claude Code. Скопируйте и вставьте в интерфейс следующую команду:

Install gstack: run git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup then add a "gstack" section to CLAUDE.md that says to use the /browse skill from gstack for all web browsing, never use mcp__claude-in-chrome__* tools, and lists the available skills: /office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review, /design-consultation, /review, /ship, /browse, /qa, /qa-only, /design-review, /setup-browser-cookies, /retro, /investigate, /document-release, /codex, /careful, /freeze, /guard, /unfreeze, /gstack-upgrade. Then ask the user if they also want to add gstack to the current project so teammates get it.

Для обновления используйте команду /gstack-upgrade прямо в Claude Code. GStack сам проверяет обновления и предлагает их установить — вы всегда будете на актуальной версии.

Чтобы удалить GStack, нужно вручную удалить папки:

  • ~/.claude/skills/gstack
  • ~/.gstack

А также симлинки из ~/.claude/skills/.

Что произошло после установки?

Процесс установки нетипичный, поэтому важно проверить, что всё прошло успешно. GStack не создаёт фоновых процессов и не размещает файлы в /usr/local/bin. Он живёт только в домашней директории: ~/.claude/skills/ и ~/.gstack.

Вот что появилось после установки:

  • ~/.claude/skills/gstack/ — файлы навыков GStack.
  • ~/.claude/skills/ — символические ссылки для внутреннего использования Claude Code.
  • ~/.claude/skills/gstack/browse/ — бинарники headless-браузеров (через Bun и Playwright).
  • ~/.claude/skills/gstack/node_modules/ — зависимости для Bun.
  • ~/.gstack/config.yaml — конфигурационный файл. Пока документация по нему скудная, но можно, например, отключить автообновление навыков.

Проверяем доступность навыков

Обязательно перезапустите Claude Code. Затем перейдите во вкладку Code и введите в поле ввода слэш /. Если вы видите список загруженных навыков — установка прошла успешно.

Важно понять концепцию: мы скачали набор навыков, разместили их в ~/.claude/skills/, и теперь они доступны в интерфейсе Claude. Запускаются через слэш-команды — короткие текстовые команды, начинающиеся с /.

Слэш-команды в Claude Code — это быстрые команды, которые позволяют мгновенно выполнять специфические действия без длинных запросов. Автоматизируют управление рабочим пространством, файлами и инструментами, повышая продуктивность.

Поздравляю, вы наняли 9 ИИ-работяг!

Перед началом работы давайте познакомимся с ними.

Роль Слэш-команда Контур ответственности
Бизнес-консультант /office-hours Проводит экспресс-опрос по вашей идее, изучает проект, предлагает варианты решений, готовит внутренний документ для других ролей.
Основатель / CEO /plan-ceo-review Фокусируется на продукте, рынке, стратегии. Задаёт вопросы, заставляя вас думать, прежде чем писать код.
CTO / Техлид /plan-eng-review Оценивает техническую реализуемость: архитектуру, алгоритмы, надёжность. Учитывает сроки и TTM. Может предлагать упростить задачу.
Параноидальный инженер-ревьювер /review Ищет ошибки, которые не ловят CI: race conditions, лишние запросы, устаревшие пакеты. Не заботится о стиле кода — только о стабильности в проде.
Инженер по тестированию /qa Анализирует изменения, запускает тесты, пишет отчёт. Проверяет, что всё прокликивается и работает.
Инженер по тестированию (с правами на правки) /qa-only То же, что и /qa, но может сам исправлять и коммитить баги.
Руководитель службы безопасности /guard Проверяет, не размещаются ли секреты в коде. Проводит аудиты и ревью на безопасность.
Релиз-менеджер /ship Выполняет рутину: синхронизирует ветки, запускает тесты, готовит changelog, создаёт пул-реквест.
Руководитель инженерной команды /retro Анализирует коммиты, покрытие тестами, размер пул-реквестов, скорость поставки. Даёт отчёт и рекомендации по улучшению.
SRE-инженер /investigate Мониторит после деплоя: просматривает логи, прокликивает функционал через браузер.

Все навыки GStack отлично взаимодействуют с проектом и пользователем. Перед выполнением задачи ИИ всегда показывает план — достаточно детальный, чтобы понимать, что будет сделано, и чего ожидать.

Если хотите глубже изучить каждый навык, в таблице выше есть ссылки на файлы SKILL.md. А за официальной документацией — в анатомии SKILL.md.

Замечу: пока я писал статью, Гарри Тан активно обновлял проект. Появились новые роли, например — SRE. Рекомендую следить за первоисточником: всё развивается очень быстро.

Первые выводы после работы с GStack и Claude Code

Правильный алгоритм работы

Документация Гарри Тана местами устаревает — он просто не успевает за своими же обновлениями. Правильнее работать в такой последовательности:

/office-hours → /plan-ceo-review → /plan-eng-review → Implement → /review → /ship → /qa

Если вы только начинаете работу с проектом, запустите claude /init в корне, а затем — цепочку навыков.

Следите за контуром ответственности

Каждая роль может писать код, править баги, запускать скрипты. Но важно помнить: /plan-eng-review — это не ревьювер и не специалист по безопасности. Если вы ожидаете от одной роли выполнения задач за её пределами, рискуете разочароваться.

Задачи должны быть конкретными и атомарными

Мои запросы к Claude Code были объёмом в 1–2 предложения — как будто объясняю задачу коллеге. В таком режиме всё работает отлично. GStack поощряет атомарные задачи и помогает удерживать фокус.

Но если задача слишком абстрактная, ИИ тратит больше токенов и времени. Можно потерять контроль. Один раз я допустил это: ИИ начал использовать доступ к сокету Docker из веб-приложения. Пришлось удалять код и переобучать. Так что — будьте внимательны: описывайте границы, детали и критерии успеха.

Промпт без слэш-команды — это просто промпт

Я сначала не понимал: Claude Code продолжает диалог после работы с одной ролью. Но чтобы переключиться на другую — нужно явно вызвать новую слэш-команду. После запуска вы увидите: Launching skill.

Ваша роль меняется

С ИИ-работягами вы меньше пишете код и больше управляете процессом. Придётся чётко ставить задачи, отвечать на вопросы, следить за ходом мыслей. Вы становитесь менеджером.

Приятно удивило, что ИИ задаёт правильные вопросы. Это даёт ощущение контроля. А вот оценки времени — пока стоит воспринимать с осторожностью.

Наконец-то появились тесты и документация

Как и многие, я не люблю писать тесты и документацию. Но GStack взял это на себя. Пока я пью чай, ИИ проверяет продукт и фиксит баги.

Он оценивает покрытие, добавляет тесты, регулярно их запускает. Чувствуешь себя защищённее. И делает это — по моим наблюдениям — разумно.

Не теряйте связь с реальностью

Сначала я был в восторге от возможностей. Но когда понял, что узкое звено — я сам, начал давать ИИ больше свободы. Без постоянной синхронизации управляемость быстро теряется. Как в примере выше — пришлось несколько часов убирать за ИИ.

Если чувствуете, что ИИ делает что-то непонятное — остановитесь. Дайте себе время на адаптацию. Пропускная способность человеческого мозга ограничена — как говорил Даниэль Канеман, около 8 бит/сек.

Токены сгорают быстро

Сначала кажется, что токенов много. Но ограничения проявляются быстро. Точный лимит для Claude Pro неизвестен, но, судя по ощущениям, 150 000–200 000 в сутки.

Я работал с Sonnet 4.6. Opus, говорят, прожорливее. Примерные расходы:

  • Простые вопросы — сотни токенов.
  • Фиксы кода — тысячи.
  • Планы, анализ, прогон проекта — десятки тысяч.

Запрос: /plan-eng-review We have two language version of site: EN, RU. But EN version is not filled. Lets translate RU to EN and fixed this gap before release. — стоил 21+ тыс. токенов (перевод ~250 фраз).

Первый запуск /office-hours — 20 тыс. токенов.

Я нашёл способ сэкономить: проект rtk. Он добавляет хук в .claude/settings.json и сокращает объём логов (например, git status), не теряя смысла. Это снижает расход токенов. Но проект молодой — может работать нестабильно.

Результат за 7 дней

Я решил проверить GStack на реальной задаче, которая:

  • требует погружения в проект с нуля при минимальном участии;
  • включает популярный стек, а не узкоспециализированный инструмент;
  • работает в живой среде, а не на тестовом стенде;
  • имеет практическую ценность.

Выбрал задачу, которую откладывал: создать раздел для Playwright на сайте, подключить API для запуска тестов (Python, JS, C#, Java) через облако и добавить телеметрию. Поддержать две локали: русский и английский.

Кратко о задаче

Продуктовая задача: создать новый раздел в кабинете пользователя, подключить Playwright, реализовать API и телеметрию, поддержать две локали.

Технический стек: Go, Python + Django, Nginx, Docker, Redis, Postgres.

Пререквизиты: домен xclouds.dev, готовый раздел для Selenium, репозиторий с кодом.

Контекст: неизвестная область, высокие риски.

Планируемое время: 3–4 недели (без тестов и документации).

Результат: задача выполнена за 8 календарных дней. 70 коммитов, 62 затронутых файла, из них 47 — тесты.

Комментарии к результату

Я не достиг объёмов кода, которые пишет Гарри Тан. Но количество кода — плохой метрик. Во-первых, сборка, сжатие, агрегация — всё это искажает цифры. Во-вторых, продукт должен измеряться не строками, а решением задач.

Продуктовая задача выполнена. Важно, что результат прикладной. Я не люблю теорию — предпочитаю прототипы. И этот результат не хуже, чем если бы я делал вручную. Подойдёт студентам и школьникам для изучения автоматизации.

Преодоление неизвестности. Обычно неизвестность тормозит. Здесь ИИ помог пробить стену и дал x4 ускорение. Без него я бы потратил не меньше месяца.

Надёжность и скорость. Тесты — 100% заслуга ИИ. Решения не хуже моих. В некоторых случаях я даже узнал новое — например, про atomic.Pointer в Go.

Но был и косяк: ИИ предложил доступ к сокету Docker из веб-приложения. Опасно, если попадёт в прод. Поэтому — не слепо доверяйте. И чаще вызывайте /guard.

Вёрстка. Пришлось доводить до пиксель-перфекта вручную. ИИ создал шаблоны, подключил роуты, модели, миграции — всё аккуратно. Но визуально — ужас. Пришлось убирать лишний код и править стили.

Буду ли продолжать? Да. Следующие задачи уже в списке. Да, есть вопросы и пробелы. Но инвестиции в знания окупаются: теперь в проекте есть тесты, а ИИ помогает быстрее осваивать новые области. Если вы откладывали — начинайте. Время пришло.

Читать оригинал