pile·
AI / ML·vercel-blogVercel Blog·

AI SDK 7 출시 — 에이전트 플랫폼으로의 전환

Vercel이 AI SDK 7을 출시하며 주간 1,600만 다운로드의 TypeScript AI 라이브러리를 단순 모델 호출 도구에서 풀스택 에이전트 플랫폼으로 전환했다. OpenAI·Anthropic·Google 등 주요 프론티어 모델의 추론 제어를 단일 API로 통합하고, 내구성 있는 에이전트 실행, 도구 승인, 비디오 생성까지 범위를 확장했다.

핵심 포인트
  • provider 무관 `reasoning` 옵션으로 OpenAI·Anthropic·Google·xAI 등 8개 제공자의 추론 강도를 단일 파라미터로 제어한다.
  • 타입화된 `runtimeContext`로 에이전트 실행 전반에서 공유 상태를 관리하고, `prepareStep`에서 단계별 모델·프롬프트를 동적으로 조정한다.
  • `contextSchema`로 도구별 필요 데이터를 범위 한정해 서드파티 도구의 불필요한 컨텍스트 접근을 차단한다.
  • `@ai-sdk/workflow`의 `WorkflowAgent`로 프로세스 재시작·배포·지연 승인에서도 살아남는 내구성 에이전트를 구현한다.
  • 총합·단계·청크·도구별 4단계 타임아웃 예산으로 에이전트 실행 시간을 세밀하게 제어한다.
  • 실험적 `generateVideo`로 fal·Google Veo·Replicate 등 6개 제공자에서 AI 영상 생성을 지원한다.
상세 정리
  • 배경: AI SDK 6까지는 모델 호출·채팅 기본 요소 중심이었으나, 프론티어 모델 보편화로 에이전트 오케스트레이션·관찰성·내구성 요구가 급증했다.
  • 추론 제어 통합: 각 제공자 API마다 다른 추론 설정을 `generateText`/`streamText`의 상위 레벨 `reasoning` 옵션으로 표준화했다. OpenAI·Anthropic·Google·Groq·xAI·Bedrock·Fireworks·DeepSeek 8개 제공자 지원.
  • 런타임 컨텍스트: `runtimeContext` 객체를 `prepareStep`·승인 함수·생명주기 콜백에서 동일하게 참조해 멀티 스텝 에이전트의 공유 상태를 단계 간에 유지한다.
  • 도구 컨텍스트 보안: `contextSchema`로 도구가 접근 가능한 정보를 스키마로 한정하여 weather 도구의 API 키가 다른 도구에 노출되지 않도록 격리한다.
  • 파일·스킬 업로드: `uploadFile`로 PDF·이미지·데이터셋을 한 번만 업로드해 멀티 스텝에서 재사용, 중복 전송을 제거한다. `uploadSkill`은 Anthropic 커스텀 스킬 등 제공자 관리 환경을 지원한다.
  • 내구성 실행: `WorkflowAgent`가 단계 간 상태를 내구적 저장소에 보존해 배포·재시작·지연 승인에서도 실행을 복구한다. 스트리밍·도구·승인·콜백 모두 지원.
  • 타임아웃 제어: `totalMs`(전체)·`stepMs`(단계)·`chunkMs`(스트리밍 청크 간격)·`toolMs`(도구별) 4단계로 설정 가능하고, 초과 시 `TimeoutError`가 중단 이유와 함께 발생한다.
  • 도구 승인: 도구별 `'user-approval'` 지정 또는 자동 승인/거부 함수 선택 가능. HMAC 서명으로 위조 방지, 입력 재검증으로 재생 공격을 방어한다.
  • HarnessAgent: Claude Code·Codex·Pi 등 외부 에이전트 하니스를 `Agent` 인터페이스로 래핑해 AI SDK의 `useChat()`·TUI와 통합 가능하다.
  • 텔레메트리: 애플리케이션 시작 시 한 번 등록으로 모든 모델 호출·에이전트·도구 전반에서 구조화된 이벤트 수집. Datadog·Langfuse·Braintrust·Sentry·Langsmith 등 7개 제공자 지원.
  • 성능 통계: `onLanguageModelCallEnd`에서 `responseTimeMs`·`outputTokensPerSecond`·`timeToFirstOutputMs` 단계별 측정이 가능해 병목 구간을 파악할 수 있다.
  • 실시간·음성: OpenAI·Google·xAI의 WebSocket 세션으로 브라우저에서 직접 연결하고, 오디오 전사·클라이언트 도구 호출을 지원한다.
  • 비디오 생성: 실험적 `generateVideo`로 Google Veo 3.1·fal·Replicate·ByteDance Seedance·Kling AI·xAI를 지원한다. 안전 경계 다운로드(크기 제한·중단 신호)가 내장돼 있다.
  • 마이그레이션: Node.js 22 이상·ESM import 필수로 변경됐다. `npx @ai-sdk/codemod v7`이 이름 변경(`system`→`instructions`, `onFinish`→`onEnd` 등) 대부분을 자동화한다.
왜 읽나AI SDK 기반으로 에이전트를 개발하거나 v6에서 v7로 마이그레이션해야 하는 TypeScript 개발자에게 핵심 변경사항과 새 기능 전체 맵을 제공한다.
vercel-blog
Vercel Blog 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. AI / ML·인프랩 (인프런)인프런 (인프랩)·

    학습 에이전트 — AI 두뇌 구축하기

    인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.

    #ai-agent#llm#llm-as-a-judge+2
  2. AI / ML·네이버 D2네이버 D2·

    AI 에이전트 회사 차리기: 설립부터 어디서든 동기화까지

    네이버 ENGINEERING DAY 2026 발표. Claude Code를 매일 쓰지만 매번 초기화되는 문제를 해결하기 위해 NaverMadCat이라는 다중 AI 에이전트 조직 프레임워크를 구축한 경험을 다룬다. 비서실장 역할의 에이전트가 10개 부서 에이전트를 조율하며, 어느 환경에서 접속해도 동일한 컨텍스트로 동작하도록 동기화 메커니즘을 구현했다.

    #claude-code#multi-agent#ai-agent+2
  3. AI / ML·vercel-blogVercel Blog·

    AI Gateway에서 실시간 음성 에이전트 구축하기

    Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.

    #llm-app#ai-sdk#realtime-voice+2