Code Review в Claude Code: AI-агенты ревьюят каждый PR

Anthropic запустила Code Review для Claude Code — команда AI-агентов проверяет каждый PR и находит баги, которые люди пропускают при быстрых ревью.

Code Review в Claude Code: AI-агенты ревьюят каждый PR
TL;DR: Anthropic запустила Code Review для Claude Code. Несколько AI-агентов параллельно проверяют каждый PR, ищут баги и фильтруют ложные срабатывания. Внутри компании это уже работает на почти каждом пулл-реквесте. Теперь доступно в research preview для Team и Enterprise.

Когда один разработчик начинает писать вдвое больше кода, кто-то должен этот код читать. И вот начинается проблема: код ревью превращается в узкое место. Все торопятся, PR пролистывают по диагонали, а баги проскальзывают в продакшен.

Anthropic столкнулась с этим на себе: объём кода на инженера вырос на 200% за год. Их ответ — Code Review, система ревью на агентах, которую они гоняют на почти каждом своём PR. Теперь её открыли для всех.

Как работает Code Review в Claude?

Когда открывается PR, Code Review запускает несколько агентов параллельно. Каждый ищет баги в своей части кода, потом результаты проверяются на false positives и сортируются по критичности.

На выходе получаешь один сводный комментарий к PR плюс инлайн-замечания к конкретным строкам. Открываешь PR и сразу видишь, где проблемы.

Ревью масштабируется под размер PR. Большие и сложные изменения получают больше агентов и более глубокий анализ, а мелкие фиксы проходят лёгкую проверку. В среднем ревью занимает около 20 минут.

Цифры от Anthropic

Anthropic гоняла систему у себя несколько месяцев и делится статистикой:

  • До Code Review 16% PR получали содержательные комментарии при ревью. После — 54%, в три с лишним раза больше
  • На больших PR (1000+ строк) 84% получают замечания, в среднем 7.5 находок
  • На маленьких (до 50 строк) — 31%, в среднем 0.5 находок
  • Менее 1% находок инженеры пометили как некорректные

Меньше процента ложных срабатываний — это серьёзно.

Реальные кейсы

Один пример из Anthropic: разработчик сделал однострочное изменение в продакшен-сервисе. Такой diff обычно получает быстрый approve — ну что там может сломаться в одной строке? Code Review пометил это как критическое: изменение ломало аутентификацию сервиса. Инженер потом признался, что сам бы не заметил.

Другой пример — от внешних пользователей. На рефакторинге ZFS-шифрования в TrueNAS (open-source middleware) система нашла предсуществующий баг в соседнем коде: type mismatch, который тихо очищал кеш ключей шифрования при каждой синхронизации. Баг был не в изменениях PR, а в коде, который PR затронул — тот тип ошибки, который человек при ревью changeset'а не стал бы целенаправленно искать.

Сколько стоит?

Это не бесплатный линтер. Code Review заточен на глубокий анализ, и стоит соответственно: от $15 до $25 за ревью, в зависимости от размера PR. Биллинг по токенам.

Расходы можно контролировать: месячные лимиты на организацию, выбор конкретных репозиториев, дашборд с аналитикой по количеству проверок и тратам.

$15–25 за ревью звучит дорого. Но если прикинуть, сколько стоит час senior-разработчика на вдумчивом ревью большого PR... цифры уже не такие страшные.

Чем отличается от GitHub Action?

У Anthropic уже есть Claude Code GitHub Action, open-source штука для автоматизации CI/CD с Claude. Code Review — это другой продукт. Action быстрый и бесплатный, Review медленный и глубокий.

Думаю, можно использовать оба: Action на каждый коммит для рутинных проверок, а Code Review перед мержем в основную ветку, когда нужен серьёзный анализ.

Как подключить?

Code Review доступен в research preview для планов Team и Enterprise.

Админ включает Code Review в настройках Claude Code, ставит GitHub App и выбирает репозитории. После этого ревью запускаются автоматически на каждый новый PR, разработчикам ничего настраивать не нужно.

Code Review не аппрувит PR, финальное решение всегда за человеком. Но разница между «пролистал diff за минуту» и «получил разбор с конкретными находками» заметная.

Вывод

Мне нравится, что Anthropic не пытается продать это как замену ревьюеру. Code Review дорогой, не быстрый и не ставит approve. Но он честно делает то, на что у живых людей обычно нет времени: вдумчиво читает код.

Не уверен, что $15–25 за каждый PR подойдёт маленькой команде. Но если у тебя Team или Enterprise план и репозитории, где баг в продакшене стоит дорого, попробовать точно стоит.

Что ещё почитать