AI / ML·
쿠팡·
Accelerating Coupang’s AI Journey with LLMs
쿠팡은 한국어·중국어 다국어 콘텐츠 처리와 대규모 LLM 학습·추론을 동시에 풀어야 했고, GPU 공급 부족과 디바이스 메모리 제약이 학습·서빙 양쪽에서 큰 병목이었다.
쿠팡은 한국어·중국어 다국어 콘텐츠 처리와 대규모 LLM 학습·추론을 동시에 풀어야 했고, GPU 공급 부족과 디바이스 메모리 제약이 학습·서빙 양쪽에서 큰 병목이었다.
쿠팡은 ML 모델 개발부터 배포까지 시간이 길고 인프라 설정이 복잡하며 GPU 자원이 부족해 빠른 실험이 어려웠다.
쿠팡 내부에서 ML 모델을 운영에 올리기까지 수 주가 걸리고 GPU 활용도 떨어지며 팀마다 인프라가 중복됐다.
텍스트 주소와 우편번호 기반의 배송 영역 관리로는 배송량 증가에 맞춘 세분화·시각화·통계가 어려웠다.
텍스트 주소와 우편번호에 의존하던 배송 영역 관리로는 단일 우편번호 구역의 일일 수백 건 배송을 감당하기 어려웠다.
클라우드 사용량 급증으로 비용이 계속 늘었지만, 엔지니어링 팀은 효율적인 사용법을 모르고 재무팀은 비용을 추적하기 어려웠다.
엔지니어링 팀의 클라우드 지출이 통제되지 않고 재무·리더십이 비용을 추적하지 못하는 상황이 누적됐다.
쿠팡 풀필먼트 센터의 도크 슬롯이 한정되어 입고 트럭 수 예측 오차로 자원 낭비와 입고 지연이 발생했다.
풀필먼트 센터의 한정된 도크 자원을 효율적으로 쓰려면 입고 트럭 수를 정확히 예측해야 하는데, 벤더 직접 예측은 과다 44.45%, 과소 8.71%로 오차가 컸다.
쿠팡 SCM 팀은 개발자, 비즈니스 분석가, 데이터 사이언티스트가 협업하며 데이터 접근과 시스템 구축에 비효율을 겪었다.