Представь свой продукт: 10+ сервисов, привычный клубок. PM приносит новую фичу, и её надо выкатить.
Допустим, твои разработчики уже каждый день работают с Claude Code, и у каждого сервиса есть свой CLAUDE.md с описанием, что он делает. На уровне кода вы уже AI-assisted. Процесс:
- Ревью PRD — разобрать требования, найти дыры, задать уточняющие вопросы, убедиться, что все одинаково поняли задачу.
- Техдизайн — описать решение: какие сервисы меняются, как и почему.
- Декомпозиция — нарезать задачи по сервисам, разнести по фронту и бэку.
- Реализация — разработчики делают свои задачи.
- QA — протестировать каждую задачу, затем прогнать полную интеграцию.
- Релиз — выкатить.
AI помогает ровно на одном шаге — на четвёртом. Всё остальное по-прежнему едет на чистом человеческом труде. Как прокачать остальное?
В чём затык: AI не знает твой продукт
Как агент отревьюит PRD или спроектирует изменения по 10 сервисам, которых он в глаза не видел? Никак. Чего не хватает — это контекста. И не файлов CLAUDE.md по каждому сервису, которые описывают сервисы по отдельности, а понимания продукта: как сервисы стыкуются друг с другом и что уже выкачено.
Собираем контекст
Что я сделал:
- Завёл отдельный репозиторий продукта.
- Задокументировал каждый сервис, с путями до кодовых баз.
- Перенёс туда все существующие PRD и техдоки из Confluence.
Полные ли эти доки? Никогда — документация всегда отстаёт от кода. Поэтому следующий шаг закрывает разрыв автоматически: натравить агента на код, чтобы он нашёл всё незадокументированное — каждую страницу, каждый хендлер — и пометил. Дорого, но это разовый шаг с огромной отдачей.
Промпт
Показать промпт
This repository contains the product documentation.
In /prd you'll find the existing PRDs.
In /architecture you'll find the existing technical docs, along with paths
to the service codebases that this product relies on.
Your task:
- Read the existing PRDs in /prd and the tech docs in /architecture to
understand what is already documented.
- Analyze the codebases referenced in /architecture.
- Cross-reference the code against the existing documentation and identify
everything that is not yet documented — frontend pages, backend handlers,
services, jobs, integrations, and any other significant parts of the code.
End goal: a fully documented product. Produce a gap report for the PM that
clearly shows what currently has no documentation coverage.
Report format — output a Markdown document with the following sections:
1. Summary — total components found, how many are documented vs.
undocumented, and overall documentation coverage (%).
2. Coverage table — one row per component:
Component | Type (FE page / BE handler / service / job / integration) |
Source path | Documented? (Yes / Partial / No) | Existing doc reference |
Priority (High / Med / Low) | Notes
3. Undocumented items, grouped by service or domain, each with a one-line
description of what it does (inferred from the code).
4. Recommendations — a prioritized list of what to document first and why.
For priority: user-facing and externally-exposed components rank highest,
internal/utility code lowest. If unsure whether something is documented,
mark it Partial and explain why in Notes.
Ручной проход по отчёту
Агент додумывает, что делает незадокументированный код, читая его, — и часть он понимает неправильно. Поэтому отчёт — это черновик, а не приговор. PM и тимлид проходят по нему один раз: подтверждают приоритеты, правят неверные трактовки, подписываются. Это важнее, чем кажется: исследования файлов контекста для агентов показывают, что наивный, непроверенный контекст способен снизить успешность задачи, подняв стоимость на 20%+. Плохой контекст хуже, чем его отсутствие. Закрываешь подтверждённые дыры — и у тебя полностью задокументированный продукт.
Как держать доки живыми
Доки гниют — именно поэтому твой Confluence изначально и был неполным, и автогенерируемые доки расходятся с реальностью так же. Исследования больших агентных систем называют устаревание спецификаций главным режимом отказа: доки перестают совпадать с реальностью, а агент уверенно строит на лжи.
Лечится это не очередной уборкой, а правилом процесса: обновление PRD и техдоков — часть Definition of Done. Меняется поведение — в том же PR меняется и док. Gap-анализ делается один раз; дальше доки остаются актуальными, потому что поддерживать их актуальность — часть поставки.
Шаги начинают автоматизироваться сами
Когда контекст продукта на месте, шаги автоматизируются один за другим.
Начни с ревью PRD — здесь рычаг максимальный, потому что требования — самое дешёвое место поймать проблему. Дефект, пойманный здесь, чинится за минуты; тот же дефект в проде стоит на порядок дороже. PM подаёт PRD, агент ревьюит его на фоне полного контекста продукта, помечает дыры и задаёт уточняющие вопросы.
Дальше техдизайн: агент ревьюит его так же — или сам набрасывает, раз уже знает сервисы. Оттуда рычаг идёт вниз по конвейеру — декомпозиция из техдизайна, тест-кейсы из PRD. Не буду перечислять всё; суть в том, что контекст разблокирует это целиком. Без него AI помогает на шаге 4. С ним — везде.
Конкретный пример
Вот как это выглядело на одном из наших продуктов.
- Масштаб: 10 сервисов, ~40 страниц фронта, ~130 хендлеров бэка.
- Gap-анализ: агент пометил ~90 незадокументированных компонентов — около 65% продукта — ценой примерно 2 часов работы агента плюс 4 часа ревью PM и тимлида.
- Закрытие дыр: 4 дня, вшитые в обычную спринтовую работу.
- После: ревью PRD, на которое уходило полдня переписки, теперь занимает ~1 час — агент возвращает дыры и уточняющие вопросы с первого прохода. На первых 5 фичах он поймал 6 неоднозначностей или пропущенных кейсов, которые раньше всплыли бы в QA или в проде.
Сетап обошёлся примерно в неделю работы в режиме part-time. Каждый PRD с тех пор экономит примерно полдня и ловит проблемы, которые ниже по потоку стоили бы куда дороже.
Это вообще обобщается?
Исследования говорят, что да — и первым делом это срабатывает прямо на ревью PRD. Индустриальное исследование на трёх реальных датасетах требований показало, что LLM улучшают обнаружение неоднозначных требований на ~20%, а эксперты оценили объяснения ИИ на 3.84 из 5 — ровно работа ревью PRD. И прирост коррелирует с контекстом, а не с размером модели: в исследовании на пяти моделях структурированный промпт вместо голого поднял качество требований до +59%. Узкое место — редко модель. Узкое место — качество контекста.
Вывод
Прежде чем что-то автоматизировать, надо создать контекст для агентов. Это не приятная мелочь — это обязательный первый шаг AI-разработки. Сделай его правильно, держи актуальным — и каждый шаг от ревью до релиза становится тем, где AI помогает, а не только шаг 4.
Источники
- Requirements Ambiguity Detection and Explanation with LLMs: An Industrial Study (ICSME 2025) — те самые ~20% и оценка 3.84/5. ipr.mdu.se
- Exploring the Use of LLMs for Requirements Extraction from User Stories (2025) — структурированные промпты повышают качество требований. researchsquare.com
- Knowledge Activation: AI Skills as the Institutional Knowledge Primitive for Agentic Software Development (2026) — вывод про «наивный контекст снижает успешность» и устаревание спецификаций как главный режим отказа. arxiv.org
- Данные по стоимости дефектов (NIST, Capers Jones, CISQ) — contextqa.com и scopemaster.com