AI SDK 7 출시
요약
TypeScript 기반의 프로덕션 에이전트 구축을 위한 AI SDK 7이 출시되었습니다. 텍스트, 오디오, 비디오 등 멀티모달 지원을 확장하고, 기존 코딩 에이전트를 SDK 생태계로 통합할 수 있는 하네스 레이어를 도입했습니다.
핵심 포인트
- 멀티모달(텍스트, 오디오, 비디오, 이미지) 에이전트 개발 지원
- Claude Code, Codex 등 외부 에이전트를 위한 하네스 레이어 도입
- MCP 패키지를 통한 도구 및 UI 통합 기능 강화
- v7 마이그레이션을 위한 자동화된 codemods 제공
AI SDK 7은 TypeScript로 프로덕션 에이전트 (production agents)를 구축하기 위한 주요 릴리스입니다. 이 SDK는 모델 호출 및 채팅 프리미티브 (chat primitives)에서 시작하여, 텍스트, 오디오, 실시간 (realtime), 이미지, 비디오 전반에 걸쳐 에이전트를 개발, 실행, 통합 및 관찰할 수 있는 더 넓은 에이전트 플랫폼으로 성장했습니다. 모든 주요 제공업체 (provider)가 즉시 지원됩니다.
AI SDK 7은 두 가지 중대한 변경 사항 (breaking requirements)을 도입합니다:
의미론적 마이그레이션 (semantic migration) 항목을 수동으로 검토하기 전에, 대부분의 임포트 (import) 및 이름 변경 변경 사항을 자동화하려면 v7 codemods를 실행하세요. .v7 전체 마이그레이션 가이드를 참조하세요.
AI SDK 7은 에이전트가 로컬 데모를 벗어날 때 필요한 프리미티브 (primitives)를 추가합니다.
AI SDK 7은 기존 코딩 에이전트를 AI SDK 생태계로 가져오기 위한 하네스 레이어 (harness layer)를 도입합니다. Claude Code, Codex, Pi와 같은 하네스 (harnesses)를 SDK의 나머지 부분에서 사용하는 것과 동일한 에이전트 인터페이스 뒤로 래핑 (wrap)하세요.
AI SDK 7은 실시간 (realtime), 비디오, 음성 (speech), 전사 (transcription), 이미지, 파일, 임베딩 (embeddings) 및 구조화된 출력 (structured output) 전반으로 SDK를 확장합니다.
v7의 UI 및 스트리밍 (streaming) 작업은 에이전트 스트림 (agent streams)을 정확하고, 조합 가능하며 (composable), 신뢰할 수 있게 만드는 데 집중합니다.
MCP 패키지는 도구 전송 레이어 (tool transport layer)에서 에이전트 도구 및 앱 UI를 위한 더 풍부한 통합 표면 (integration surface)으로 성장합니다.
시작하려면 다음 프롬프트를 AI 코딩 에이전트에게 보내세요:
다음 하이라이트는 가장 영향력 있는 프로모션 (promotions)을 다룹니다:
다음 하이라이트는 가장 영향력 있는 이름 변경 (renames)을 다룹니다:
다음 하이라이트는 가장 영향력 있는 지원 중단 (deprecations)을 다룹니다:
기존 프로젝트를 AI SDK 7로 마이그레이션하려면 다음 단계를 따르세요:
가이드가 포함된 마이그레이션을 위해, AI SDK v7 마이그레이션 스킬을 설치하고 에이전트에게 앱에 적용하도록 요청하세요:
한눈에 보기
업그레이드 전 주의사항
에이전트 개발
프로덕션에서 에이전트 실행
에이전트 하네스 통합
에이전트 관찰
텍스트를 넘어선 구축
UI, 스트림 및 메시지 처리
MCP 구성
런타임 및 패키징 구성
업그레이드 경로
-
추론 제어 (reasoning control), 도구 및 런타임 컨텍스트 (tool and runtime context), 프로바이더 파일 (provider files) 및 스킬 지원, MCP 앱, 그리고 터미널 UI를 통해. 에이전트 개발 (Develop agents)
-
도구 승인 (tool approvals), 내구적 실행 (durable execution), 퍼스트 클래스 타임아웃 (first-class timeouts), 그리고 샌드박스 (sandbox) 지원을 통해. 에이전트 실행 (Run agents)
WorkflowAgent -
Codex, Claude Code, Deep Agents, OpenCode 또는 Pi와 같은. 어떠한 에이전트 하네스(agent harness)도 통합 (Integrate any agent harness)
-
재설계된 텔레메트리 (telemetry), Node.js 트레이싱 채널 (tracing channel) 지원, 라이프사이클 콜백 (lifecycle callbacks), 그리고 단계별 성능 통계 (step performance statistics)를 통해. 에이전트 동작 관찰 (Observe agent behavior)
@ai-sdk/otel -
안정적인 음성/전사 (speech/transcription) API, 더 풍부한 파일 파트 (file parts), 이미지 생성 및 편집, 멀티모달 임베딩 (multimodal embeddings), 리랭킹 (reranking), 실시간 음성 (realtime voice, 실험적 기능), 그리고 비디오 생성 (video generation, 실험적 기능)을 통해. 텍스트를 넘어선 구축 (Build beyond text)
-
새로운 마이그레이션 스킬 (migration skill), 코드모드 (codemods), 그리고 ESM, Node.js 22, , , , , , 및 를 위한 마이그레이션 경로를 통해. 더 명확한 API로 업그레이드 (Upgrade with clearer APIs)
instructionstelemetrystreamfinalStepruntimeContexttoolsContext -
: SDK가 이전 LTS 라인으로 백포트(backport)되지 않은 API(네이티브 구현 및 개선된 시맨틱 포함)에 의존하기 때문에 Node 22가 필요합니다. Node.js 22 최소 사양 (Node.js 22 minimum)
fetchAsyncLocalStorage -
: 및 이제 OpenAI, Anthropic, Google, Groq, xAI, Bedrock, Fireworks, DeepSeek, Open Responses, 그리고 OpenAI 호환 프로바이더 전반에 걸쳐 프로바이더 네이티브 설정에 매핑되는 최상위 옵션을 지원합니다. 정확한 동작과 사용 가능한 파라미터는 프로바이더마다 다를 수 있습니다. 프로바이더에 구애받지 않는 추론 제어 (Provider-agnostic reasoning control)
generateTextstreamTextreasoning -
: 공유된 오케스트레이션 상태 (orchestration state)는
runtimeContext, 승인 함수 (approval functions), 라이프사이클 콜백 (lifecycle callbacks), 텔레메트리 (telemetry), , 그리고 에 거주하며 흐릅니다. 타입이 지정된 런타임 컨텍스트 (Typed runtime context)runtimeContextprepareStepToolLoopAgentWorkflowAgent -
Scoped tool context (범위가 지정된 도구 컨텍스트): 도구는
contextSchema를 선언할 수 있고, 호출자는toolsContext를 통해 도구별 값을 제공하므로, 제3자 도구는 필요한 비밀 정보(secrets)나 설정(config)만 수신합니다. -
Provider file uploads (프로바이더 파일 업로드): 대용량 입력을 한 번 업로드하고 이후 호출에서 프로바이더 참조를 재사용하여, 반복되는 PDF, 데이터셋, 이미지 및 다단계 워크플로(workflows)에서의 중복 업로드를 줄입니다.
uploadFile -
Provider skill uploads (프로바이더 스킬 업로드): 프로바이더 관리형 스킬 환경(skill environments)에 동일한 패턴을 도입합니다.
uploadSkill -
MCP Apps (MCP 앱): MCP 지원에 이제 모델 가시적(model-visible) 도구와 앱 전용(app-only) 도구의 구분, 앱 메타데이터, 샌드박스 iframe 렌더링, 그리고 도구, 리소스, 로그 및 디스플레이 업데이트를 위한 JSON-RPC 통신이 포함됩니다.
-
Terminal agent development (터미널 에이전트 개발): 대화형 터미널 UI에서 AI SDK 에이전트를 실행하여, 전체 앱을 구축하기 전에 추론(reasoning), 도구, 마크다운(markdown) 출력을 테스트할 수 있습니다.
@ai-sdk/tui -
Tool approvals (도구 승인):
generateText,streamText,ToolLoopAgent는 호출 또는 에이전트 수준에서 승인 정책(approval policies)을 정의할 수 있습니다. 정책은 사용자 승인 요구, 자동 승인, 자동 거부 또는 타입이 지정된 승인 함수(typed approval functions)로 위임할 수 있습니다. -
Hardened approval replay (강화된 승인 재생): 위험도가 높은 승인 흐름은 계속하기 전에 도구 입력과 정책을 재검증할 수 있으며,
WorkflowAgent승인 검증을 사용하고 HMAC 서명(HMAC signing)을 선택할 수 있습니다. HMAC 서명은 원래의 도구 입력을 승인 토큰에 암호학적으로 결합하여, 승인 요청과 재개 사이에서 도구 인자(arguments)가 변조되는 것을 방지합니다. -
Durable execution (내구성이 있는 실행): 장시간 실행되는 에이전트를 위한 기능을
@ai-sdk/workflow및WorkflowAgent에 도입합니다. 실행 상태(execution state)가 단계 사이에 영구 저장소(durable storage)에 보존되므로, 에이전트는 배포(deploys), 프로세스 재시작, 중단 및 지연된 승인 상황에서도 유지됩니다. 자세한 내용은 WorkflowAgent docs를 참조하세요. -
: 스트리밍 (streaming), 도구 (tools), 승인 (approvals), 타입이 지정된 런타임 및 도구 컨텍스트 (typed runtime and tool context), 라이프사이클 콜백 (lifecycle callbacks), 안정적인 텔레메트리 (stable telemetry), 제공자 실행 승인 재개 (provider-executed approval resumption), 그리고 도구 결과 변환 (tool result conversion)을 지원합니다. 워크플로 인식 에이전트 기능 (Workflow-aware agent features)
WorkflowAgent -
: 텍스트 생성 및 에이전트 API는 전체, 단계별 (per-step), 청크별 (per-chunk), 기본 도구 및 도구별 타임아웃 예산 (timeout budgets)을 정의할 수 있습니다. 타임아웃 중단은
TimeoutError를 사용하며, 중단 사유는 스트림 및 UI 프로토콜을 통해 전달됩니다. 일급 타임아웃 (First-class timeouts)TimeoutError -
: 샌드박스 추상화 (sandbox abstractions)는 명령 실행 (command execution), 스트리밍 출력 (streaming output), 작업 디렉토리 (working directories), 환경 변수 (environment variables), 중단 신호 (abort signals), 그리고 단계 수준의 샌드박스 오버라이드 (step-level sandbox overrides)를 지원합니다. 샌드박스 실행 (Sandboxed execution)
-
: AI SDK 인터페이스를 통해 외부 에이전트 하네스 (agent harnesses)를 실행하며, 표준 및 결과값은
Agent,generate,stream을 사용합니다. 하네스 에이전트 (HarnessAgent) -
: Claude Code, Codex, Pi 하네스 어댑터 (harness adapters)를 통해 팀은 기존 에이전트 런타임을 AI SDK 앱에 연결할 수 있습니다. 코딩 에이전트용 어댑터 (Adapters for coding agents)
-
: 하네스 에이전트는 샌드박스, 지침 (instructions), 커스텀 스킬 (custom skills), 도구를 전달받을 수 있으므로, 동일한 런타임을 서로 다른 제품과 워크플로에 맞춰 형성할 수 있습니다. 구성 가능한 하네스 실행 (Configurable harness runs)
-
: 워크플로 유틸리티 (workflow utilities), 세션 브릿징 (session bridging), 그리고 중단된 턴의 지속을 위한 API는 하네스 실행을 더 긴 코딩 작업에 적합하게 만듭니다. 내구성이 있고 재개 가능한 세션 (Durable, resumable sessions)
-
: 하네스 어댑터는 AI Gateway를 위한 Vercel OIDC를 지원하여, 호스팅 및 샌드박스 에이전트 실행을 간소화합니다. 게이트웨이 준비 완료 인증 (Gateway-ready authentication)
-
: 텔레메트리를 한 번만 등록하면 모델 호출, 단계, 도구, 임베딩 (embeddings), 리랭킹 (reranking), 그리고 에이전트 실행 전반에 걸쳐 구조화된 이벤트를 수신할 수 있습니다. 글로벌 텔레메트리 통합 (Global telemetry integrations)
-
: OpenTelemetry 지원은 이제
@ai-sdk/otel에 포함되어 있으며, GenAI-시맨틱 컨벤션 스팬 (GenAI-semantic convention spans) 및 메트릭 (metrics), 보충적인 AI SDK 속성 (attributes), 그리고 스팬 강화 훅 (span-enrichment hooks)을 제공합니다. 더 자세히 알아보려면 @ai-sdk/otel docs를 참조하세요. 전용 OpenTelemetry 패키지 (Dedicated OpenTelemetry package)@ai-sdk/otel -
: 런타임 및 도구 컨텍스트 (Runtime and tool context)를 텔레메트리 (telemetry)에 의도적으로 포함할 수 있으며, 기본적으로 비밀 정보가 노출되는 것을 방지하는 제어 기능이 포함되어 있습니다. 민감한 컨텍스트 제어 (Sensitive context controls)
-
: 콜백 (Callbacks) 기능이 핵심 함수 (core functions), 에이전트 (agents), 도구 (tools), 임베딩 (embeddings), 리랭킹 (reranking), 구조화된 출력 (structured output), 그리고 UI 스트림 (UI streams) 전반에 걸쳐 더욱 일관되게 적용됩니다. 콜백 페이로드 (Callback payloads)는 스텝 (step), 사용량 (usage), 콘텐츠 (content), 파일 (file), 소스 (source), 경고 (warning), 도구 (tool), 모델 호출 (model-call), 그리고 에러 (error) 이벤트에 대해 더 풍부한 데이터를 전달합니다. 라이프사이클 콜백 (Lifecycle callbacks)
-
: 스텝 결과 (Step results)를 통해 응답 시간 (response time), 총 스텝 시간 (total step time), 도구 실행 시간 (tool execution time), 첫 출력 시간 (time to first output), 초당 출력 토큰 수 (output tokens per second)를 포함한 타이밍 및 처리량 메트릭 (timing and throughput metrics)을 확인할 수 있습니다. 성능 통계 (Performance statistics)
-
: OpenAI, Google, xAI를 위한 브라우저-제공자 간 WebSocket 세션을 지원하며, 오디오/텍스트 대화, 클라이언트 주도 도구 호출 (client-driven tool calls), 그리고 AI Gateway를 통한 정규화된 라우팅 (normalized routing)을 제공합니다. 실시간 (Realtime, 실험적 기능)
-
: 비디오 생성 (Video generation) 기능이 AI Gateway, Google AI Studio, Google Vertex, fal, Replicate, ByteDance Seedance, Kling AI, Prodia, 그리고 xAI에서 작동하며, 장시간 실행되는 SSE 응답과 더 안전한 제한적 다운로드 (bounded downloads)를 지원합니다. 비디오 생성 (Video generation, 실험적 기능)
-
:
generateSpeech,transcribe,SpeechResult,TranscriptionResult는 안정적인(stable) 내보내기 항목입니다. 안정적인 음성 및 전사 (Stable speech and transcription) -
: 이미지 파트 (Image parts)가 다른 미디어와 동일한 표준 파일 모델 (canonical file model)로 이동합니다. 도구 출력 (Tool outputs)은 인라인 데이터 (inline data), URL, 제공자 참조 (provider references), 그리고 텍스트 기반 콘텐츠 (text-backed content)를 위해 단일한 형태를 사용할 수 있습니다. 파일로서의 이미지 (Images as files)
file -
: 제공자 (Providers)들이 이미지 생성 (image generation), 이미지 편집 (image editing), 멀티모달 임베딩 (multimodal embeddings), 음성 (speech), 전사 (transcription), 리랭킹 (reranking), 파일 참조 (file references), 추론 파일 (reasoning files), 그리고 제공자별 미디어 메타데이터 (provider-specific media metadata)를 추가합니다. 더 풍부한 미디어 및 모델 지원 (Richer media and model support)
-
: Zod 및 Standard Schema 입력에 대한 JSON 스키마 (JSON Schema) 후처리가 더욱 엄격해졌으며, 구조화된 출력 (structured outputs) 및 도구 호출 (tool calls)에 대해 잘못된 형식의 JSON 추출 및 복구 기능이 제공됩니다. 또한, 배열 출력 모드 (array output mode)는 변환 (transforms), 강제 변환 (coercions), 기본값 (defaults), 그리고 파이프 (pipes)를 보존합니다. 구조화된 출력 신뢰성 (Structured output reliability)
-
: UI 코드에서 직접
Agent를 호출할 수 있습니다. 직접 에이전트 전송 (Direct agent transport)DirectChatTransport,Agent -
: UI 메시지가 자동 승인 응답을 지원하며, 개선된 승인 재현 (approval replay) 동작을 지원합니다. UI 흐름 내 도구 승인 (Tool approval in UI flows)
-
: React 콜백이 현재 props/state와 함께 업데이트됩니다; 비동기 조건을 지원하며; Vue는 관용적인 컴포저블 (composable)을 얻었고; Angular API는 현재 AI SDK 패턴과 일치하도록 조정되었습니다. 프레임워크 개선 (Framework improvements)
useChat,sendAutomaticallyWhen -
: 종료 청크 (finish chunk) 이전에 끝나는 프로바이더 스트림 (Provider streams)은 에러로 처리되며, 도구 실행 에러가 방출되고 예측 가능하게 정리됩니다. 또한 스트리밍 추론 (streaming reasoning)의 예외 케이스들이 더 일관되게 처리됩니다. 더 신뢰할 수 있는 스트림 (More reliable streams)
-
: 프로바이더 메타데이터 (Provider metadata)가 텍스트 생성, UI 스트림, 도구 호출, 그리고 멀티 턴 프로바이더 ID 매핑 전반에 걸쳐 유지됩니다. 프로바이더 메타데이터 보존 (Provider metadata preservation)
-
: 최상위
content, 도구 호출/결과,files,sources,warnings,usage, 그리고 이제finalStep이 전체 실행 (run)을 나타냅니다. 최종 단계 전용 상세 정보는finalStep을 통해 사용할 수 있습니다. 멀티 스텝 결과 (Multi-step results)content,files,sources,warnings,usage,finalStep -
: MCP 클라이언트가 프로토콜 버전
2025-11-25, 서버 메타데이터, 서버 지침, 핑 (ping) 응답, 협상된 프로토콜 헤더, 그리고 공개listTools()를 지원합니다. 프로토콜 및 메타데이터 (Protocol and metadata)2025-11-25,listTools() -
: MCP 도구는
outputSchema와structuredContent를 노출할 수 있으며, 도구 정의를 실행 가능한 도구와 분리할 수 있습니다. 타입화된 도구 출력 (Typed tool outputs)outputSchema,structuredContent -
: 도구 결과와 프롬프트 메시지에 MCP 콘텐츠를 포함할 수 있습니다. 리소스 콘텐츠 (Resource content)
resource_link -
: MCP 앱은 샌드박스 처리된 iframe 내에서 앱 전용 UI를 렌더링하기 위해 도구 메타데이터를 사용하며, 모델에 보이는 도구와 앱 전용 도구를 분리하여 유지합니다. 앱 렌더링 (App rendering)
-
: HTTP, SSE, 그리고 OAuth 전송 (transports) 방식이 커스텀
fetch, 리다이렉트 설정, OAuth 리프레시 중복 제거, 상태 검증, 비동기 클라이언트 인증, 더 풍부한 에러 메시지, 그리고 더 나은 SSE 프레임 핸들링을 지원합니다. 전송 신뢰성 (Transport reliability)fetch -
: AI SDK 패키지는 Node.js 22 이상을 필요로 합니다. Node.js 22 최소 요구
-
: AI SDK 7은 ESM 임포트 (
import구문 또는.mjs파일)를 필요로 합니다.package.json을 업데이트하여 `
AI 자동 생성 콘텐츠
본 콘텐츠는 Vercel AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기