AI / ML·
pinterest-eng·
Pinterest 사용자 시퀀스 데이터 플랫폼 재설계 — 학습/서빙 통합
문제사용자 시퀀스 데이터가 학습·오프라인 분석·온라인 추론에서 각각 다르게 정의되어 비용·유지보수·훈련-서빙 불일치 문제 발생.
접근설정-코드(configuration-as-code) 로 시퀀스 정의 단일화 + 스트리밍·배치가 같은 실행 엔진 공유. 람다 아키텍처(실시간 + 배치) + 시간 분할 컬럼 저장소로 "한 번 정의, 다양한 런타임" 원칙 적용.
결과신규 인리치먼트 온보딩 시간 대폭 단축, 추천 서빙 사용자 참여도 개선, 저장소 효율성/네트워크 전송량 절감으로 인프라 비용 감소 (정량 수치 미공개).