pile·
AI / ML·vercel-blogVercel Blog·

@mux/ai SDK로 내결함성 영상 AI 워크플로우 구축하기 — Workflow DevKit 체크포인팅

Mux가 Vercel Workflow DevKit과 협력해 7단계 영상 AI 파이프라인(전사·요약·분류·챕터·자막·검열·임베딩)의 내결함성 처리를 위한 @mux/ai SDK를 출시했다. "use workflow"/"use step" 디렉티브로 표준 Node.js 환경에선 일반 함수처럼 동작하고, Workflow DevKit 배포 시엔 자동 재시도·상태 지속·옵저버빌리티가 활성화되는 계층화 방식을 채택했다.

핵심 포인트
  • "use workflow", "use step" 디렉티브는 표준 Node.js 환경에선 일반 함수처럼 동작하고, Vercel Workflow DevKit 배포 시 자동 재시도·상태 지속·옵저버빌리티를 활성화한다.
  • 이전 단계가 완료된 지점부터 재개하는 체크포인트 방식으로 중간 실패 시 전체 재실행이 불필요하다.
  • 긴 작업을 여러 서버리스 함수 실행으로 분산해 타임아웃 문제를 방지한다.
  • "Worlds" 개념으로 로컬 JSON 기반, Vercel 관리형, 자체 호스팅(Postgres/Redis) 세 가지 배포 환경을 동일 코드로 지원한다.
  • OpenAI·Anthropic·Gemini 멀티 LLM을 지원하며 Apache 2.0으로 공개했다.
상세 정리
  • 문제: 영상 AI 파이프라인은 전사→요약→분류→챕터→자막→검열→벡터 임베딩 7단계로 구성된다. 중간 실패 시 메시지 큐·상태 머신·재시도 로직·옵저버빌리티를 모두 직접 구현해야 했다.
  • 설계 원칙 1 — 필수 인프라 의존성 없음: "use workflow"/"use step" 디렉티브는 표준 Node.js 환경에선 일반 함수처럼 동작한다. 별도 인프라 없이 개발·테스트가 가능하다.
  • 설계 원칙 2 — 선택적 내결함성: Workflow DevKit 배포 시에만 자동 재시도, 상태 지속, 체크포인팅이 활성화된다. 필요할 때만 인프라 비용을 지불한다.
  • 설계 원칙 3 — 친숙한 JS 패턴: 새로운 DSL이나 상태 머신 정의 없이 일반 JavaScript 패턴 그대로 사용한다.
  • 체크포인팅: 요약 생성 완료 후 검열 API 호출이 실패하면, 요약 단계를 다시 실행하지 않고 검열 단계부터 재개한다. 이전 단계 결과는 상태 저장소에 유지된다.
  • 서버리스 타임아웃 해결: 긴 작업을 여러 서버리스 함수 실행으로 분산한다. 단일 함수 실행 타임아웃 한계를 우회한다.
  • Worlds 개념: 로컬 개발(JSON 기반 경량 지속성), Vercel 관리형(제로 설정 프로비저닝 + 자동 스케일링 + 옵저버빌리티 대시보드), 자체 호스팅(Postgres/Redis 백엔드) 세 가지 환경을 동일 코드로 지원한다.
  • 빌트인 워크플로우: 영상 요약·자동 분류, 챕터 생성, 콘텐츠 검열, 다국어 번역, 벡터 임베딩 생성 등 5가지 워크플로우를 사전 제공한다.
  • 멀티 LLM: OpenAI, Anthropic, Gemini를 지원한다.
  • 라이선스: Apache 2.0으로 공개해 자유로운 커스터마이징이 가능하다.
왜 읽나멀티 스텝 AI 워크플로우를 서버리스 환경에서 안정적으로 실행하고 싶은 AI/백엔드 개발자에게. 인프라 의존성 없이 시작하고 필요 시 내결함성을 레이어링하는 설계 패턴과, 체크포인팅·자동 재시도를 표준 JS 패턴으로 구현하는 방법을 실제 SDK 사례로 볼 수 있다.
vercel-blog
Vercel Blog 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. AI / ML·인프랩 (인프런)인프런 (인프랩)·

    학습 에이전트 — AI 두뇌 구축하기

    인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.

    #ai-agent#llm#llm-as-a-judge+2
  2. AI / ML·네이버 D2네이버 D2·

    AI 에이전트 회사 차리기: 설립부터 어디서든 동기화까지

    네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.

    #claude-code#multi-agent#ai-agent+2
  3. AI / ML·vercel-blogVercel Blog·

    AI Gateway에서 실시간 음성 에이전트 구축하기

    Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.

    #llm-app#ai-sdk#realtime-voice+2