pile·
최신
  1. 인프라 / DevOps·discord-blogDiscord Blog·

    Discord API의 기능별 비용 귀속 시스템

    Discord가 1,700개 이상의 API 엔드포인트와 700개 백그라운드 태스크를 단일 Python 코드베이스로 수백 개 Kubernetes 배포에서 운영하면서 기능별 인프라 비용을 귀속시키는 시스템을 구축했다. 클라우드 제공사가 Kubernetes 배포 단위까지만 비용을 나눠주기 때문에 메시징·스트리밍 등 개별 기능의 실제 비용을 파악하기 어려웠고, CPU 시간 직접 샘플링으로 이 문제를 해결했다.

    #kubernetes#cost-optimization#observability+2
  2. 인프라 / DevOps·twilio-engTwilio Engineering·

    음성 재해 복구는 구현 전 준비가 전부다

    Twilio 엔지니어가 2025년 리전 클라우드 장애에서 드러난 음성 재해 복구(Voice DR)의 맹점을 분석하고, 구현 시작 전 준비가 성패를 가른다는 6단계 프레임워크를 제시했다. 음성 통화는 요청을 재시도할 수 없는 실시간 동기 인터랙션이라 10초 침묵만으로도 발신자가 이탈할 수 있어, 복구는 플랫폼·애플리케이션·옵저버빌리티 세 계층의 사전 조율에 달려있다.

    #observability#sre#voice+2
  3. 아키텍처·라포랩스 (퀸잇)라포랩스 (퀸잇)·

    플랫폼은 왜 계속 다시 설계되어야 할까 - Server Platform Team 이야기

    라포랩스 Server Platform Team 이 조직 성장에 맞춰 배포·권한·이벤트·부팅 같은 플랫폼 기반을 계속 다시 설계한 이야기를 인터뷰 형식으로 다룬다. "좋은 플랫폼은 책에서 가져올 수 없고 회사 규모·팀 구조·제품 이터레이션을 관찰한 결과로만 나온다"는 철학 아래, 자율성과 안정성의 균형을 맞춘 사례들을 짚는다.

    #platform-engineering#devops#observability+2