AI 에이전트 회사 차리기: 설립부터 어디서든 동기화까지
네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.
네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.
CLAUDE.md에 규칙을 많이 추가할수록 Claude가 이를 무시하는 "Context Rot" 현상이 발생한다. 긴 입력일수록 lost-in-the-middle 효과로 모델 성능이 저하된다.
14개 레포에서 한 주치 Git 커밋을 모아 주간 업무 보고서로 정리한 뒤 Confluence에 올리는 작업이 매주 30~60분씩 들었고, 포맷 일관성과 누락 방지도 사람이 일일이 챙겨야 했다.
많은 팀이 CLAUDE.md 와 커스텀 프롬프트에 집중하지만 정작 코드베이스 구조가 AI 친화적이지 않으면 에이전트 PR 이 아키텍처 원칙을 몰래 위반하고 누적된다.
AI 기반 개발 생명주기(AI-DLC)를 Brownfield(기존 코드 개선)와 Greenfield(신규 개발) 두 프로젝트에 동시에 적용해야 한다.
300명 규모 엔지니어링 조직에서 AI 툴 도입 효과를 측정하기 어렵고, AI를 조언자에서 실질적인 작업자로 전환하는 방법이 불분명하다.
비엔지니어가 Claude Code 를 도입했을 때 정량적 ROI 를 측정할 표준 지표가 없어 효율성/비용 효과를 설명하기 어렵다.
분석가가 하루 4~7건만 처리하던 반복적 데이터 분석 요청을 자동화하고 더 전략적 업무에 집중하도록 함.
포스타입 캐릭터톡 MVP 를 별도 서비스로 분리할지, 기존 포스트 생태계에 통합할지, 그리고 초기 콘텐츠 풀과 실시간 채팅 인프라를 어떻게 빠르게 구축할지가 과제였다.
에이전트형 코딩 도구가 코드를 빠르게 만들수록 CI/CD, 보안 스캔, 리뷰, 승인 같은 배포 단계가 병목이 된다.
Spotify가 30개 넘는 리소스 타입과 중첩 타겟팅 구조를 가진 복잡한 Ads API v3를 자연어로 다루게 만든 Claude Code 플러그인 사례다. "코네티컷 25-44세, 일 $100 예산 캠페인 만들어줘" 같은 문장을 올바른 다단계 API 호출 시퀀스로 변환하는 것이 목표다.
코딩 경험이 거의 없어도 MCP와 AI 코딩 에이전트로 실용적인 도구를 직접 만들 수 있는지 검증이 필요했다.
10년 된 Spring 4.0/MyBatis 레거시의 380개 자바 클래스와 49개 SQL을 사람이 일일이 훑어 성능 병목과 보안 이슈를 찾기에는 시간과 인지 비용이 너무 컸다.
DevOps 의 PR 리뷰/의존성 점검/일일 보고 같은 추론 필요 반복 작업을 사람 손으로 매번 수행하면 시간이 많이 들고, n8n 같은 절차 자동화 도구로는 맥락 판단이 어렵다.
기존 Copilot식 코드 보조만으로는 구현부터 PR까지의 개발 생산성 향상을 충분히 체감하기 어려웠다.
일일 400만 명이 사용하는 알라미 iOS 앱에서 반복 작업(빌드·테스트·PR 생성·배포)이 개발 속도를 제한했다.
일일 400만 명이 사용하는 알라미 iOS 앱에서 반복 작업(빌드·테스트·PR 생성·배포)이 개발 속도를 제한했다.
AI 보조로 엔지니어 코드 생성이 51%, PR 생산량 98% 늘면서 "탐색-발산-수렴" 목업 중심 디자인 프로세스가 병목이 됐다.
AI Native 레포만으로는 부족했고 팀챗·터미널·GitHub·Datadog 을 오가며 AI 를 수동 조율해야 했다.
Claude Code 로 복잡한 멀티 파일 작업을 하다가 잘못된 편집을 되돌릴 안전망이 필요했다.