Кейс • RAG-система
Умный поиск по коду и документации
Как мы улучшили точность генерации кода на 35% и ускорили поиск по документации для продуктовой компании
+35%
Точность генерации
300ms
Время ответа
50K+
Файлов в индексе
10x
Быстрее поиска
Задача клиента
- •Разработчики тратят до 30% времени на поиск нужного кода и документации
- •Стандартный поиск по репозиторию не понимает контекст и семантику
- •Новые сотрудники долго разбираются в кодовой базе
- •Генерация кода через ChatGPT не учитывает стиль и паттерны компании
Цели проекта:
- Создать семантический поиск по всей кодовой базе
- Генерировать код в стиле компании с учётом существующих паттернов
- Ускорить онбординг новых разработчиков
- Отвечать на вопросы о коде на естественном языке
Решение
RAG-система для кода с контекстным пониманием
Система на базе embeddings и LLM, которая индексирует код, понимает его семантику и генерирует ответы с учётом контекста проекта
Семантический поиск по 50K+ файлов за 300ms
Понимание зависимостей между файлами и модулями
Генерация кода в стиле проекта с использованием существующих паттернов
Ответы на вопросы о коде на русском и английском языках
Интеграция с IDE через плагин
Автоматическое обновление индекса при изменениях в репозитории
Результаты через 1 месяц
| Показатель | Было | Стало |
|---|---|---|
| Точность генерации кода | 60% | 95% |
| Время поиска информации | 15 минут | 30 секунд |
| Онбординг нового разработчика | 2 недели | 3 дня |
| Время ответа системы | — | 300ms |
| Удовлетворённость разработчиков | — | 92% |
Что получил клиент
Разработчики экономят 2+ часа в день на поиске информации
Код генерируется с учётом стиля и паттернов компании
Новички становятся продуктивными в 5 раз быстрее
Вся документация и код доступны через единый интерфейс
Система обучается на каждом запросе и становится точнее
Технологии
OpenAI Embeddings • GPT-4 • Python • FastAPI • Qdrant • PostgreSQL • GitHub API