Pinterest 사용자 시퀀스 데이터 플랫폼 재설계 — 학습/서빙 통합
문제사용자 시퀀스 데이터가 학습·오프라인 분석·온라인 추론에서 각각 다르게 정의되어 비용·유지보수·훈련-서빙 불일치 문제 발생.
접근설정-코드(configuration-as-code) 로 시퀀스 정의 단일화 + 스트리밍·배치가 같은 실행 엔진 공유. 람다 아키텍처(실시간 + 배치) + 시간 분할 컬럼 저장소로 "한 번 정의, 다양한 런타임" 원칙 적용.
결과신규 인리치먼트 온보딩 시간 대폭 단축, 추천 서빙 사용자 참여도 개선, 저장소 효율성/네트워크 전송량 절감으로 인프라 비용 감소 (정량 수치 미공개).
이 글과 비슷한
- AI / ML·
dropbox-tech· - AI / ML·
aws-architecture·Amazon EKS 와 머신러닝으로 ALS GeoAnalytics LITHOLENS™ 의 코어 로깅 자동화하기
문제광산 시추 코어 분석은 현장 육안 검사와 전문가 의존도가 높아 비용, 일관성, 처리 속도 문제가 컸다.
접근LITHOLENS를 Amazon EKS, Lambda, S3, RDS 기반 하이브리드 아키텍처로 구성했다. K-Means, GMM, RoQE Net, VeinNet 등 ML/컴퓨터 비전 모델을 GPU 워크로드로 실행했다.
결과10개 광산 회사와 40개 이상 프로젝트에서 분석 표준화와 원격 처리 효과를 얻었다. 전문가 출장 부담을 줄이고 광물 분류 정확도와 추적성을 높였다.
#eks#machine-learning#geoanalytics - AI / ML·
aws-architecture·Amazon EC2 G7e 인스턴스에서 Synthesia 의 생성형 AI 비디오 추론 최적화하기
문제생성형 비디오 모델은 VAE latent decoding과 frame copy 과정이 순차적으로 묶여 GPU 활용률과 추론 지연에 병목이 생긴다.
접근EC2 G7e의 NVIDIA RTX PRO 6000 Blackwell GPU에서 asynchronous frame generation pipeline을 구성했다. GPU/host double buffering, page-locked memory, 별도 copy stream과 worker thread로 전송과 후처리를 겹쳤다.
결과디코딩, D2H 전송, 파일 쓰기를 병렬화해 GPU idle 시간을 줄였다. 대용량 비디오 inference에서 비용 대비 처리량을 높이는 패턴을 제시했다.
#inference#generative-ai#ec2+1