pile·
DB / 데이터·버즈빌버즈빌·

RDS MySQL IOPS 장애 대응기

문제RDS MySQL의 IOPS가 RPS 대비 비정상적으로 높았다. 버퍼풀 히트율이 98%였음에도 디스크 I/O가 지속됐다.
접근InnoDB 데이터·인덱스 합계 170GB를 확인하고 Working set이 메모리를 초과함을 진단했다. m5.2xlarge(32GB)에서 r6g.2xlarge(61GB), r6g.4xlarge(128GB)로 단계적으로 스케일업했다.
결과Read IOPS가 3,000에서 80 수준으로 안정화됐고, Freeable memory 여유가 확보됐다.
버즈빌
버즈빌 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. DB / 데이터·pinterest-engPinterest Engineering·

    Pinterest 차세대 DB 수집 프레임워크의 자동화된 스키마 진화

    Pinterest의 CDC 기반 DB 수집 파이프라인은 MySQL에서 Kafka, Flink, Spark, Iceberg를 거치는 다층 구조다. 스키마 변경이 생기면 모든 계층을 동시에 업데이트해야 해 드리프트, 배포 실패, 데이터 불일치가 반복됐다. Pinterest 엔지니어링 팀은 이를 해결하기 위해 가산적 변경만 자동화하는 스키마 진화 프레임워크를 구축하고, PR 기반 롤아웃과 SLA 기반 일관성 모델을 도입했다.

    #data-pipeline#apache-flink#cdc+2