갑자기 느려진 빌링 파이프라인 — ClickHouse 안에 숨어 있던 병목
문제ClickHouse 파티션 키 변경 뒤 청구 집계 쿼리가 느려졌지만 I/O, 메모리, 읽은 파트 수 지표는 정상으로 보였다.
접근trace_log와 flame graph로 쿼리 플래너의 MergeTreeData mutex 경합, 벡터 복사, 선형 파트 필터링을 찾아 공유 락·캐시·이진 탐색 패치를 적용했다.
결과락 경합을 제거하고 2026년 3월 패치로 쿼리 시간이 50% 감소했으며, 파트 수와 지연의 상관을 끊었다.