pile·
인프라 / DevOps·여기어때 (GC컴퍼니)여기어때 (GC컴퍼니)·

EKS + ALB 환경에서 Argo Rollouts 503 에러 없는 카나리 배포 적용기

문제EKS + ALB 환경에서 Argo Rollouts Blue/Green과 기본 Canary 모두 Promote 시점에 약 30초간 503이 발생했다.
접근Service selector 변경 → ALB target 재등록 구간이 원인이고, AWS Load Balancer Controller readiness gate가 selector 교체된 Pod에 주입되지 않는 구조적 한계 때문이다. Argo Rollouts v1.2 Canary PingPong으로 ping/pong Target Group을 고정해 Promote 시 ForwardConfig weight만 0↔100 swap하고, Ingress backend를 `name: use-annotation` 으로 바꿔 ALB ForwardConfig를 활성화했다.
결과Python keep-alive 멀티스레드로 8개 시나리오를 돌린 결과 정상 자동·수동 배포·Abort·KEDA 스케일링은 503 0건, mid-rollout 중복 배포만 약 6초 발생 — 정상 운영에서는 드문 케이스다.
여기어때 (GC컴퍼니)
여기어때 (GC컴퍼니) 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. 인프라 / DevOps·vercel-blogVercel Blog·

    Vercel CLI 드라이런 배포로 실제 배포 전 구성 미리 확인하기

    Vercel CLI v54.17.2부터 vercel deploy --dry 명령으로 실제 파일 업로드 없이 배포 구성을 미리 검사할 수 있다. 프레임워크 감지 결과, 포함/제외 파일 목록, 디렉터리 크기 분포, 콘텐츠 해시까지 사전에 확인하고 나서 배포를 결정할 수 있어 의도치 않은 배포 실패를 예방한다.

    #deployment#ci-cd#vercel-cli+1