AI 에이전트를 위한 Cloudflare 임시 계정
AI 에이전트가 OAuth 인증 없이 Cloudflare Worker를 즉시 배포할 수 있는 임시 계정(Temporary Accounts) 기능을 Cloudflare가 출시했다. 기존 Wrangler CLI는 로그인이 필요해 에이전트 자동화 루프를 깼지만, `wrangler deploy --temporary` 한 줄로 에이전트가 자율 배포→검증 사이클을 완성할 수 있게 됐다.
AI 에이전트가 OAuth 인증 없이 Cloudflare Worker를 즉시 배포할 수 있는 임시 계정(Temporary Accounts) 기능을 Cloudflare가 출시했다. 기존 Wrangler CLI는 로그인이 필요해 에이전트 자동화 루프를 깼지만, `wrangler deploy --temporary` 한 줄로 에이전트가 자율 배포→검증 사이클을 완성할 수 있게 됐다.
삼성 이커머스의 가격 제공 시스템이 시간당 크론 잡 기반 캐싱에서 AWS Lambda Response Streaming을 활용한 실시간 스트리밍 아키텍처로 전환한 과정을 다룬다. 기존 방식은 30개 이상 제품 변형 조합의 폭발과 1시간 동기화 지연으로 플래시 세일 중 오래된 가격이 노출되는 문제가 있었다. 신규 아키텍처는 P90 레이턴시를 4,500ms에서 50ms로 90배 단축하고 인프라를 100개 이상 인스턴스에서 Lambda 5~10개로 단순화했다.
AWS는 Amazon Bedrock Data Automation과 AWS HealthLake를 조합해 스캔된 PDF 의료 기록을 FHIR R4 구조화 데이터로 자동 변환하는 서버리스 파이프라인 아키텍처를 소개한다. 수동 데이터 입력 비용과 비구조화 문서 통합 문제를 이벤트 기반 Lambda 오케스트레이션으로 해결한다.
AWS SDMA(Spatial Data Management and Analytics)를 이용해 건물 검사 워크플로를 개선하는 레퍼런스 아키텍처를 소개한다. 기존 검사 프로그램이 생성하는 이미지·관측 데이터가 독립 파일로 흩어져 재사용이 어렵다는 문제를 "공간 참조 데이터"로 취급해 해결한다.
금융기관의 기존 KYC 시스템은 배치 처리와 수동 인계 때문에 실시간 심사, 확장성, 규제 대응이 어렵다.
마케팅 자동화를 개발팀에 매번 의뢰하면 속도가 안 나오고, 대형 캠페인 트래픽으로 시스템이 흔들린다.
Vercel이 AWS 데이터베이스(Aurora PostgreSQL, Amazon DynamoDB, Aurora DSQL)를 대시보드에서 직접 프로비저닝할 수 있는 통합을 출시했다. OIDC 기반으로 연결마다 IAM 인증 토큰을 동적 생성해 저장 비밀번호가 없으며, Vercel의 AWS 인프라 기반 덕분에 경쟁사 대비 절반 수준인 평균 1ms 라운드 트립을 기록했다.
Mux가 Vercel Workflow DevKit과 협력해 7단계 영상 AI 파이프라인(전사·요약·분류·챕터·자막·검열·임베딩)의 내결함성 처리를 위한 @mux/ai SDK를 출시했다. "use workflow"/"use step" 디렉티브로 표준 Node.js 환경에선 일반 함수처럼 동작하고, Workflow DevKit 배포 시엔 자동 재시도·상태 지속·옵저버빌리티가 활성화되는 계층화 방식을 채택했다.
모놀리식을 ECS 마이크로서비스로 분해했지만 트래픽이 불규칙한 보조 서비스에는 컨테이너 운영 비용이 과하다.
외부 온콜 솔루션이 해외 번호 발신으로 스팸 차단되고 간헐적 발신 실패 + 월 200만 원 고정 비용이 발생했다.
Vite + React CSR 앱에서 멤버십 플랜별 동적 OpenGraph가 필요했지만 소셜 크롤러가 JS를 실행하지 않아 CSR에서는 초기 HTML에 메타 태그를 심을 수 없었다.
Vercel 이 2025년 블랙프라이데이-사이버먼데이(BFCM) 주말에 처리한 인프라 지표를 공개했다. 총 1,158억 건 요청, 초당 518,027건 피크 트래픽, 6,100만 건 배포를 별도 사전 용량 준비 없이 자동으로 처리했다. Fluid compute, ISR, AI Gateway 가 실전에서 자동 스케일링으로 동작한 실증 데이터다.
수동 배포(개인 PC에서 EB CLI 직접 배포)와 모놀리식 구조로 배포 이력 추적 불가, 환경 경계 모호, 기능 출시 속도 저하가 발생했다.
Vercel AI Gateway가 Fluid Compute 위에서 일일 수십억 토큰을 처리하는 아키텍처를 공개했다. 스트리밍 AI 요청은 CPU 작업이 7.5%, 대기 시간이 92.5%인 구조라 Active CPU Pricing으로 실제 처리 시간만 과금해 기존 서버리스 대비 비용을 대폭 절감한다. Anycast 라우팅, in-function 동시성, Redis 기반 상태 관리, 자동 폴백 라우팅이 핵심 구성 요소다.
Vercel의 오픈소스 Workflow Development Kit(WDK)은 기존 async/await 함수를 충돌·재배포 후에도 중단 지점에서 정확히 재개되는 지속성 워크플로우로 변환하는 TypeScript 프레임워크다. use workflow와 use step 두 지시문만으로 메시지 큐, 재시도 로직, 상태 저장 계층을 언어 수준에 통합하며, 결정론적 재생(deterministic replay) 방식으로 신뢰성을 보장한다.
서버리스 환경에서 콜드 스타트는 첫 방문자나 트래픽 급증 시 성능 저하를 유발하는 고질적 문제다. Vercel의 Fluid 컴퓨트 플랫폼은 다섯 가지 보완적 전략을 결합해 전체 요청의 99.37%에서 콜드 스타트를 제거했다. Scale to One, Fluid Compute, Predictive Scaling, Bytecode Caching, Rolling Releases로 구성된 각 전략의 동작 방식과 실측 성능 데이터를 상세히 설명한다.
라이브커머스 성장에 따라 AWS ELB + ECS 컴퓨팅 비용이 급증했다. 프론트엔드 서버 트래픽이 다른 API 서버보다 월등히 높아 고정 비용 부담이 컸다.
서버리스에서 데이터베이스 연결 수가 폭발한다는 통념은 잘못됐다. 동시 요청 1,000개 기준 서버·Lambda·Vercel 모두 필요 연결 수는 동일하다. 진짜 문제는 함수 suspend 중 유휴 연결의 타임아웃 타이머가 멈춰 연결이 수분간 누출되는 현상이며, Vercel Fluid의 attachDatabasePool이 waitUntil 패턴으로 이를 해결한다.
Vercel이 경량 웹 표준 기반 백엔드 프레임워크 Hono를 제로 설정으로 지원하기 시작했다. Hono 앱을 작성하고 vc deploy 한 번으로 배포하면, Fluid Compute와 Active CPU 가격 모델 등 Vercel의 백엔드 최적화가 자동으로 적용된다.
Vercel이 Fluid Compute 아키텍처의 기술적 내부를 공개했다. AWS Lambda의 단일 요청 모델 한계를 극복하기 위해 Rust 기반 코어, TCP 커스텀 전송 계층, 요청 다중화를 구현했으며, 2년 개발 끝에 주간 450억 요청을 처리하고 I/O 집약적 워크로드에서 비용 90% 이상 절감을 달성했다.