AI 에이전트 시대, 어떻게 만들고 어떻게 일하는가

발행

RAG, MCP, 하네스 엔지니어링, 컨텍스트 비용 절감까지 — 한국·글로벌 12개 회사가 LLM 에이전트를 만들고 운영하는 실전기.

글: 12

01
AWS Korea Tech
GraphRAG Toolkit으로 지식 그래프 쿼리하기
벡터 검색이 "질문과 의미적으로 유사한" 문서만 찾아, 단어는 달라도 구조적으로 연결된 핵심 리스크를 놓치는 한계를 GraphRAG 로 푸는 방법을 다룬다. AWS GraphRAG Toolkit 이 Amazon Neptune 그래프와 OpenSearch 임베딩을 결합해 엔티티·관계를 따라가며 검색하는 구조와, 두 가지 검색기의 선택 기준을 코드까지 짚어 설명한다.
02
마켓컬리 Hello World
AI에게 도메인을 가르치다 두 번 갈아엎은 이야기 — LLM Wiki + RAG 혼합기
컬리가 배송 도메인 지식을 LLM 에 주입하려다 마크다운 문서가 쌓이며 토큰 비용과 "lost in the middle"에 부딪혀, 검색 구조를 두 번 갈아엎은 과정을 다룬다. inverted index → 본문 임베딩 → 요약 임베딩+본문 FTS 분업으로 이어지며, 결국 "무엇을 모델에 맡기고 무엇을 도구·사람에 분담할지 선을 옮긴 작업"이라는 결론에 닿는다.
03
Pinterest Engineering
Pinterest 의 MCP 생태계 구축
Pinterest는 AI 에이전트가 내부 데이터와 도구를 안전하게 호출할 공통 프로토콜과 거버넌스가 필요했다.
04
LINE Engineering
ODW #5: 벡터 DB와 에이전트 스킬로 RAG 시스템 만들기
대량의 개발 문서 검색에 시간이 많이 들고, 사내 전문가 상담도 비효율적이다.
05
우아한형제들
하네스 엔지니어링(harness engineering)으로 팀 맞춤형 AI 환경 구축하기
AI 코딩 도구가 프로젝트 맥락·컨벤션을 모르기 때문에 같은 설명을 매번 반복하고, 개발자별 지시 방식이 달라 코드 스타일도 흔들린다.
06
무신사 테크
AI 스페셜리스트와 자동사냥 — 하네스로 제어하는 AI 파이프라인
물류 WMS의 반복적인 슬로우 쿼리 대응은 범용 AI만으로는 코드베이스 맥락 부족 때문에 피상적 제안에 머물렀다.
07
Stack Overflow Blog
AI 코딩 에이전트 오케스트레이션 실전 경험기
O'Reilly 저자 Andrew Stellman 이 Claude Code 와 Gemini 를 조율해 21,000줄 Python 배치 처리 도구 Octobatch 를 약 75시간에 만든 경험에서, AI 코딩 에이전트를 실전에서 오케스트레이션하는 법을 정리한다. 핵심은 AI 와의 개발이 오히려 개발자에게 더 높은 기준을 요구한다는 점 — 좋은 코드 감각·아키텍처 유지·실패 패턴 감지·단순성 추구가 성패를 가른다.
08
LINE Engineering
ODW #7: 세 가지 방법으로 토큰 소비량 40% 절감! ADK를 이용한 컨텍스트 엔지니어링
사내 AI 툴 도입 확산에 따라 토큰 소비가 예상치를 초과하고, 긴 대화에서 컨텍스트 누적으로 AI 출력 품질이 저하되는 문제가 발생했다.
09
AWS Korea Tech
Part 3: Kiro로 RDS/Aurora 장애 분석 자동화하기 — 매일 자동으로 보고서 받기
AWS 의 Kiro CLI 시리즈 3부로, RDS/Aurora 장애 분석을 EC2 + cron 으로 매일 자동 실행해 HTML 보고서를 만들고 S3 presigned URL 을 SES 이메일과 Slack 으로 발송하는 운영 파이프라인을 다룬다. Part 1·2 의 IDE·터미널 분석을 무인 스케줄 배포로 확장한 셈이다.
10
AWS Korea Tech
현대오토에버의 Amazon Bedrock으로 구축한 빅데이터 클러스터 장애 대응 자동화 에이전트 구축기
하둡 기반 빅데이터 클러스터 장애 시 수동 로그 수집·원인 분석에 3시간 이상 소요되어 야간·주말 대응이 어려웠다.
11
카카오 테크
메시징 서버의 스트레스 테스트 노하우와 AI 가 덜어 준 부분
메시징 팀의 반복 스트레스 테스트(배포·실행·메트릭 수집·리포트)는 1사이클당 50분 이상 걸려 큰 비용이었다.
12
베스핀글로벌
AI Paradox (1) | LLM 인프라 비용, 1시간 만에 8,500만 원 날라간 이유
AI PoC 월 300만 원이 본 운영 전환 시 3,800만 원까지 폭증. GPU 유휴율 68%, 토큰 폭주로 71분 만에 8,500만 원 손실 사례.