Pinterest Engineering

pinterest-eng

Pinterest Engineering의 엔지니어링 블로그. 매시간 RSS로 자동 수집해요.

원문 사이트 ↗📡RSS

13

전체

+1

이번 주

최신

AI / ML·Pinterest Engineering·1주 전
Pinterest 파운데이션 모델의 선형에 가까운 분산 훈련 스케일링 달성기
Pinterest는 월 6억 명 이상의 사용자를 서비스하는 추천 시스템 파운데이션 모델의 분산 훈련 스케일링 문제를 다룬다. 초기 멀티 노드 확장 시 2노드에서 성능이 0.2x로 역행했고, AWS EFA 도입 후에도 4노드 기준 1.21x에 그쳤다. 5단계 최적화를 통해 4노드 3.9x, 8노드 7.5x의 거의 선형에 가까운 스케일링을 달성했다.
#embedding#recommendation-system#pytorch+2
DB / 데이터·Pinterest Engineering·1주 전
Pinterest 차세대 DB 수집 프레임워크의 자동화된 스키마 진화
Pinterest의 CDC 기반 DB 수집 파이프라인은 MySQL에서 Kafka, Flink, Spark, Iceberg를 거치는 다층 구조다. 스키마 변경이 생기면 모든 계층을 동시에 업데이트해야 해 드리프트, 배포 실패, 데이터 불일치가 반복됐다. Pinterest 엔지니어링 팀은 이를 해결하기 위해 가산적 변경만 자동화하는 스키마 진화 프레임워크를 구축하고, PR 기반 롤아웃과 SLA 기반 일관성 모델을 도입했다.
#data-pipeline#apache-flink#cdc+2
AI / ML·Pinterest Engineering·1개월 전
Pinterest 사용자 시퀀스 데이터 플랫폼 재설계 — 학습/서빙 통합
Pinterest 가 ML 모델 학습·서빙에 쓰는 사용자 시퀀스 데이터(최근 N개 행동) 플랫폼을 비용·속도·사용성 면에서 다시 설계한 사례를 다룬다. 학습·분석·온라인 추론 세 곳에서 쓰이며 ML 데이터 스택에서 가장 비싸고 깨지기 쉬운 부분이던 것을, 설정-코드·공유 엔진·Lambda 아키텍처·칼럼형 저장으로 풀었다.
#data-engineering#data-pipeline#feature-store+2
AI / ML·Pinterest Engineering·1개월 전
An Engineer’s Guide to Better AI Skills: Implementing a Testing Process to Optimize Agent…
에이전트가 저장소별 커스텀 skill을 항상 로드한다고 가정하면 iOS 아키텍처 같은 도메인 지식 적용이 불안정해진다.
#prompt-engineering#agent-engineering#ai-skills+1
AI / ML·Pinterest Engineering·1개월 전
Sequential Recommender 모델에 실시간 컨텍스트를 통합한 광고 관련성 강화
기존 광고 후보 생성 모델은 오프사이트 행동 기반 임베딩만 써서 Related Pins나 Search의 실시간 맥락을 반영하지 못했다.
#transformer#recommender-system#ad-tech+1
AI / ML·Pinterest Engineering·2개월 전
ML 워크로드 네트워크 효율 최적화 (Part I): Feature Trimmer
Pinterest의 root-leaf ML 서빙 구조에서 모델 추론보다 root-leaf 네트워크 대역폭이 먼저 병목이 됐다.
#ml-workload#network-efficiency#feature-trimmer+1
AI / ML·Pinterest Engineering·2개월 전
Pinterest 의 쇼핑 전환 후보 생성 아키텍처 — 클릭에서 전환까지
Pinterest 쇼핑 광고는 offsite conversion 신호가 희소하고 지연돼 engagement 중심 retrieval만으로 구매 의도를 최적화하기 어려웠다.
#recommender-system#pinterest#conversion-optimization
백엔드·Pinterest Engineering·2개월 전
대규모 URL 정규화 — Pinterest 콘텐츠 중복 제거를 지원하는 MIQPS
대규모 URL에서 추적용 query parameter와 콘텐츠를 바꾸는 parameter를 구분하지 못해 중복 제거 품질이 흔들렸다.
#pinterest#url-normalization#deduplication
인프라 / DevOps·Pinterest Engineering·2개월 전
시스템 속 좀비 찾기 — 실제 CPU 병목 사례
Pinterest의 분산 ML job이 간헐적 네트워크 timeout으로 실패해 GPU 자원을 낭비했다.
#pinterest#cpu-bottleneck#incident-debugging
AI / ML·Pinterest Engineering·2개월 전
요청 단위 중복 제거로 추천 시스템 확장하기
추천 모델을 100배 키우면 user sequence가 후보 item마다 중복 처리되어 storage, training, serving 비용이 급증했다.
#recommender-system#pinterest#request-deduplication
모바일·Pinterest Engineering·2개월 전
모두를 위한 성능
Android 화면마다 체감 완료 시점을 따로 측정하면 성능 개선 범위가 제한되고 일관된 latency 지표를 얻기 어려웠다.
#engineering-culture#performance#pinterest
AI / ML·Pinterest Engineering·2개월 전
Pinterest 홈피드의 다목적 최적화 진화 과정
Home Feed 추천은 즉시 save 같은 단일 목표만 최적화하면 다양성이 줄고 장기 만족도와 session time이 악화됐다.
#pinterest#multi-objective#recommender
AI / ML·Pinterest Engineering·3개월 전
Pinterest 의 MCP 생태계 구축
Pinterest는 AI 에이전트가 내부 데이터와 도구를 안전하게 호출할 공통 프로토콜과 거버넌스가 필요했다.
#mcp#pinterest#ai-tools-ecosystem