pile·
인프라 / DevOps·여기어때 (GC컴퍼니)여기어때 (GC컴퍼니)·

옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법

문제Grafana LGTM 스택 컴포넌트별 Pod requests가 실제 사용량과 맞는지 판단할 객관적 기준이 없었다.
접근이미 수집 중이던 `container_memory_working_set_bytes` 와 `container_cpu_usage_seconds_total` 를 1주일·5분 간격 P95로 집계하고, 적정 Request = P95 / 목표 사용률 로 역산했다. Ingester(쓰기, +50%) · Compactor(burst) · Distributor/Query-frontend(stateless, +25%) 처럼 컴포넌트별 버퍼를 차등하고, CPU는 `container_cpu_cfs_throttled_periods_total` 비율을 함께 모니터링했다.
결과Stateless → Stateful 읽기 → Stateful 쓰기 → burst 순으로 단계 적용해 OOMKill·Throttling 증가 없이 인프라 리소스를 절감했다. 분기 점검은 쿼리 실행·판단만 남는다.
여기어때 (GC컴퍼니)
여기어때 (GC컴퍼니) 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 인프라 / DevOps·vercel-blogVercel Blog·

    Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기

    Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.

    #deployment#ci-cd#vercel-cli+1