GitLab이 소프트웨어 개발 생명주기(SDLC) 전반의 데이터를 단일 그래프로 연결하는 Orbit을 공개 베타로 출시했다. AI 에이전트가 파이프라인·배포·이슈·소유권을 코드와 연결해 이해하려면 파편화된 컨텍스트를 넘어 전체 SDLC를 그래프로 탐색할 수 있어야 한다는 문제에서 출발한다.
핵심 포인트- Orbit은 코드, MR, 파이프라인, 배포, 취약점, 소유 관계를 라이브 그래프에 인덱싱하고 Cypher 유사 DSL·MCP·REST·CLI로 조회를 지원한다.
- ClickHouse로 CDC(변경 데이터 캡처)를 수집하고 12개 언어(Ruby, Java, Kotlin, Python, TypeScript 등) 코드를 파싱해 500M 노드·2B 엣지 그래프를 45분 이내에 완성하며 이벤트 기반으로 실시간 갱신한다.
- Compare the Market의 79개 MR 대상 A/B 테스트에서 Orbit 기반 코드 리뷰어가 RAG 방식 대비 70% vs 58% 정확도를 기록했다.
- 에이전트 벤치마크: 11배 빠른 응답 시간, 4.5배 적은 토큰 소비, 45배 낮은 환각률.
- GitLab 인스턴스를 직접 쿼리하지 않고 독립 동작하는 분리 서비스로 설계해 운영 API에 부하를 주지 않는다.
상세 정리- 문제: 대형 모노레포에서 AI 에이전트가 파일을 탐색하며 컨텍스트를 재구성하다가 컨텍스트 윈도우를 소진하거나 태스크 실패하는 사례가 반복됐다.
- RAG 한계: 코드 청크를 임베딩으로 분리 저장하면 파이프라인·배포·소유권 같은 관계형 컨텍스트를 연결할 수 없고, 멀티-레포 환경에서 그래프 탐색이 불가능하다.
- 설계 원칙: 에이전트가 GitLab 인스턴스 API를 직접 호출하지 않도록 독립 서비스로 분리해 운영 안정성을 확보한다.
- 데이터 수집: Change-Data-Capture 방식으로 ClickHouse에 적재, 코드 파서가 12개 언어의 함수·클래스·의존성을 파싱해 그래프 노드와 엣지로 변환한다.
- 쿼리 인터페이스: Cypher 유사 DSL로 그래프 탐색, MCP 서버로 Claude Code 같은 에이전트 도구와 연동, REST API·GitLab CLI도 지원한다.
- 활용 시나리오: 파이프라인 실패에서 원인 MR 역추적, 취약점의 영향 서비스·파이프라인·담당자 매핑, 마이그레이션 의존 컴포넌트 전수 조회, 팀/파이프라인별 사이클 타임 집계가 가능해진다.
- Data Explorer UI: 동일 그래프를 사람이 직접 인시던트 트리아지, 의존성 추적에 활용해 기존 수 시간 작업을 수 초로 단축한다.
- 현재 상태: GitLab.com Premium/Ultimate 공개 베타. 엔터프라이즈 온프레미스는 추후 지원 예정.
왜 읽나AI 에이전트를 실제 개발 워크플로우에 통합하려는 팀이 RAG 한계를 넘어 그래프 기반 코드 인텔리전스 인프라를 구축하는 접근을 실측값과 함께 파악할 수 있다.