AI 에이전트 시대, 어떻게 만들고 어떻게 일하는가
발행RAG, MCP, 하네스 엔지니어링, 컨텍스트 비용 절감까지 — 한국·글로벌 12개 회사가 LLM 에이전트를 만들고 운영하는 실전기.
- 글
- 12
- 01
AWS Korea TechGraphRAG Toolkit으로 지식 그래프 쿼리하기
벡터 검색이 "질문과 의미적으로 유사한" 문서만 찾아, 단어는 달라도 구조적으로 연결된 핵심 리스크를 놓치는 한계를 GraphRAG 로 푸는 방법을 다룬다. AWS GraphRAG Toolkit 이 Amazon Neptune 그래프와 OpenSearch 임베딩을 결합해 엔티티·관계를 따라가며 검색하는 구조와, 두 가지 검색기의 선택 기준을 코드까지 짚어 설명한다.
- 02
마켓컬리 Hello WorldAI에게 도메인을 가르치다 두 번 갈아엎은 이야기 — LLM Wiki + RAG 혼합기
컬리가 배송 도메인 지식을 LLM 에 주입하려다 마크다운 문서가 쌓이며 토큰 비용과 "lost in the middle"에 부딪혀, 검색 구조를 두 번 갈아엎은 과정을 다룬다. inverted index → 본문 임베딩 → 요약 임베딩+본문 FTS 분업으로 이어지며, 결국 "무엇을 모델에 맡기고 무엇을 도구·사람에 분담할지 선을 옮긴 작업"이라는 결론에 닿는다.
- 03
Pinterest EngineeringPinterest 의 MCP 생태계 구축
Pinterest는 AI 에이전트가 내부 데이터와 도구를 안전하게 호출할 공통 프로토콜과 거버넌스가 필요했다.
- 04
- 05
우아한형제들하네스 엔지니어링(harness engineering)으로 팀 맞춤형 AI 환경 구축하기
AI 코딩 도구가 프로젝트 맥락·컨벤션을 모르기 때문에 같은 설명을 매번 반복하고, 개발자별 지시 방식이 달라 코드 스타일도 흔들린다.
- 06
무신사 테크AI 스페셜리스트와 자동사냥 — 하네스로 제어하는 AI 파이프라인
물류 WMS의 반복적인 슬로우 쿼리 대응은 범용 AI만으로는 코드베이스 맥락 부족 때문에 피상적 제안에 머물렀다.
- 07
Stack Overflow BlogAI 코딩 에이전트 오케스트레이션 실전 경험기
O'Reilly 저자 Andrew Stellman 이 Claude Code 와 Gemini 를 조율해 21,000줄 Python 배치 처리 도구 Octobatch 를 약 75시간에 만든 경험에서, AI 코딩 에이전트를 실전에서 오케스트레이션하는 법을 정리한다. 핵심은 AI 와의 개발이 오히려 개발자에게 더 높은 기준을 요구한다는 점 — 좋은 코드 감각·아키텍처 유지·실패 패턴 감지·단순성 추구가 성패를 가른다.
- 08
LINE EngineeringODW #7: 세 가지 방법으로 토큰 소비량 40% 절감! ADK를 이용한 컨텍스트 엔지니어링
사내 AI 툴 도입 확산에 따라 토큰 소비가 예상치를 초과하고, 긴 대화에서 컨텍스트 누적으로 AI 출력 품질이 저하되는 문제가 발생했다.
- 09
AWS Korea TechPart 3: Kiro로 RDS/Aurora 장애 분석 자동화하기 — 매일 자동으로 보고서 받기
AWS 의 Kiro CLI 시리즈 3부로, RDS/Aurora 장애 분석을 EC2 + cron 으로 매일 자동 실행해 HTML 보고서를 만들고 S3 presigned URL 을 SES 이메일과 Slack 으로 발송하는 운영 파이프라인을 다룬다. Part 1·2 의 IDE·터미널 분석을 무인 스케줄 배포로 확장한 셈이다.
- 10
AWS Korea Tech현대오토에버의 Amazon Bedrock으로 구축한 빅데이터 클러스터 장애 대응 자동화 에이전트 구축기
하둡 기반 빅데이터 클러스터 장애 시 수동 로그 수집·원인 분석에 3시간 이상 소요되어 야간·주말 대응이 어려웠다.
- 11
카카오 테크메시징 서버의 스트레스 테스트 노하우와 AI 가 덜어 준 부분
메시징 팀의 반복 스트레스 테스트(배포·실행·메트릭 수집·리포트)는 1사이클당 50분 이상 걸려 큰 비용이었다.
- 12
베스핀글로벌AI Paradox (1) | LLM 인프라 비용, 1시간 만에 8,500만 원 날라간 이유
AI PoC 월 300만 원이 본 운영 전환 시 3,800만 원까지 폭증. GPU 유휴율 68%, 토큰 폭주로 71분 만에 8,500만 원 손실 사례.