OpenTelemetry 도입기
Kubernetes 기반 MSA 전환 과정에서 서비스 복잡도가 늘고 모니터링 데이터가 파편화됐다.
Kubernetes 기반 MSA 전환 과정에서 서비스 복잡도가 늘고 모니터링 데이터가 파편화됐다.
Jumpit·Comate 등 외부 플랫폼 이력서(HTML)를 서비스 내에 렌더링할 때 외부 CSS가 기존 페이지 스타일을 오염시키는 충돌 문제
온프레미스 환경에서 개발·프로덕션 정적 파일 혼재로 CDN 캐시 오염, 불필요한 개발 리소스 프로덕션 누적, 브랜치별 병렬 개발 불가
롤링 업데이트 방식의 로드밸런서 전환 과정에서 간헐적 에러·배포 실패 시 서비스 전체 중단 위험·13분 30초의 긴 배포 시간
긴 스택 트레이스가 Slack에 뭉텅 쏟아져 근본 원인 파악에 시간 낭비, 개발자가 외부 도구 없이 빠른 분석이 어려운 상황
사람인 내부의 도움말·채용공고·기업 정보를 LLM과 결합해 사용자 1차 문의를 자동화해야 했고, 환각 현상을 제어할 수 있는 구조가 필요했다.
Kubernetes 환경에서 마이크로서비스 규모가 확대되면서 파편화된 모니터링 도구들로는 서비스 간 인과관계 추적과 운영 효율성 확보가 어려웠다.
기존 ASG 기반 Cluster Autoscaler가 인스턴스 타입 제한·Reserved Instance 부족·노드 NotReady·느린 스케일 감지를 해결 못 해 프로덕션에서 수동 개입 빈번
FE 분리 후 Monorepo 환경에서 동적 feature 브랜치 배포와 review 서버 관리가 수동으로 복잡했다.
17가지 필터 조건을 여러 컴포넌트가 공유해야 하는 인재풀 서비스에서 복잡한 공통 상태 관리가 필요했다.