Автоматизация Code review с помощью больших языковых моделей

Автоматизация Code review с помощью больших языковых моделей

Автоматизация Code review с помощью больших языковых моделей может ускорить процесс разработки и поддерживать высокое качество кода.

Причины для автоматизации процесса Code review

Ревью кода — рутинный процесс, который может тормозить выпуск фичей. Автоматизация этого процесса может сократить нагрузку на разработчиков и уменьшить время на разработку новых фичей.

Архитектура системы Code review

Система состоит из трёх компонентов: Stash, Go-сервис и Python ML Pipeline service.

Выбор LLM-модели

Была выбрана модель Qwen3-Coder-30B-Instruct-FP8, которая показала хорошие результаты по метрикам.

Этапы ML-пайплайна

ML-пайплайн включает три основных этапа: RuleChecker, ReviewFilter и CommentAggregator.

Метрики решения

Метрики показывают, что 85% комментариев разработчики классифицируют как хорошие, и треть комментариев действительно помогает разработчикам исправлять код.

Читать оригинал