pile·
인프라 / DevOps·카카오페이카카오페이·

환경미화 프로젝트(부제: 카카오페이 k8s에서 낭비되는 자원을 절약해 보자!)

문제카카오페이 Kubernetes 환경에서 Pod이 실제 사용량(CPU 0.5 core 미만 80%, Memory 1 Gi 미만 20%)보다 훨씬 큰 자원을 요청해 비용 낭비와 신규 서비스 이관 시 자원 부족이 발생했다.
접근Google Autopilot 논문을 참고해 사용량 히스토그램 95분위에 안전마진 15%를 더한 추천값을 계산한다. MutatingWebhook으로 Pod 라벨을 자동 부여하고, Prometheus Recording Rule로 메트릭을 사전 집계해 쿼리 비용을 줄였다.
결과테스트 환경 약 400개 서비스에 적용해 CPU 238 core(8.8%), Memory 155 Gi(4.7%)를 절감했다. EKS 환경에서는 EC2 노드 감소로 즉각적인 비용 절감이 나타났다.
카카오페이
카카오페이 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 인프라 / DevOps·vercel-blogVercel Blog·

    Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기

    Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.

    #deployment#ci-cd#vercel-cli+1