DeepSeek V4 on AI Gateway
요약
DeepSeek V4가 Vercel AI Gateway를 통해 사용할 수 있게 되었으며, 두 가지 변형인 DeepSeek V4 Pro와 DeepSeek V4 Flash가 제공됩니다. V4 Pro는 복잡한 코딩, 수학적 추론 및 장문 문서 작성에 최적화되어 있는 반면, V4 Flash는 빠른 응답 속도와 낮은 비용을 유지하면서 강력한 성능을 제공하여 고부하 워크로드에 적합합니다. 사용자는 AI Gateway의 통합 API를 활용하여 모델 호출, 비용 관리, 그리고 지능형 라우팅 및 재시도 기능을 사용할 수 있습니다.
핵심 포인트
- DeepSeek V4는 Vercel AI Gateway에서 접근 가능하며, 두 가지 버전(Pro와 Flash)으로 제공됩니다.
- DeepSeek V4 Pro는 에이전트 코딩, 복잡한 추론 및 장기 워크플로우에 특화되어 있습니다.
- DeepSeek V4 Flash는 빠른 응답 속도와 낮은 비용을 유지하면서 견고한 성능을 제공하여 고부하 환경에 적합합니다.
- AI Gateway는 모델 호출, 사용량/비용 추적, 지능형 라우팅 및 자동 재시도 기능을 통합적으로 제공합니다.
DeepSeek V4 는 이제 Vercel AI Gateway 에서 사용할 수 있습니다. DeepSeek V4 Pro 와 DeepSeek V4 Flash 라는 2 가지 모델 변형이 있습니다.
두 모델 모두 기본 컨텍스트 윈도우는 1M 토큰입니다.
DeepSeek V4 Pro 는 에이전트 코딩, 형식적 수학 추론, 장기 범위의 워크플로우에 중점을 둡니다. 스택 전반에 걸친 기능 개발, 버그 수정, 리팩토링을 처리하며 MCP 워크플로우 및 에이전트 프레임워크와 같은 하네스 전반에서 작동하는 도구 사용을 지원합니다. 또한 명확하고 잘 구조화된 장문 문서를 작성합니다.
DeepSeek V4 Flash 는 추론 능력에서 V4 Pro 에 근접하며, 더 작은 파라미터 크기를 통해 빠른 응답과 낮은 API 비용을 유지하면서 단순한 에이전트 작업에서도 견고한 성능을 발휘합니다. 이는 고부하 워크로드와 지연 시간 민감형 사용 사례에 적합합니다.
DeepSeek V4 를 사용하려면 AI SDK 에서 모델을 deepseek/deepseek-v4-pro 또는 deepseek/deepseek-v4-flash 로 설정하세요.
AI Gateway 는 모델 호출, 사용량 및 비용 추적, 제공업체 가용성보다 높은 수준의 성능을 위한 재시도, 페일오버, 성능 최적화를 구성할 수 있는 통합 API 를 제공합니다. 내장형 커스텀 리포팅, 관찰 가능성, 자동 재시도를 포함한 지능형 제공업체 라우팅이 포함되어 있습니다.
Bring Your Own Key
[Vercel AI Gateway] 에 대해 자세히 알아보거나, 모델 리더보드를 확인하거나, [model playground] 에서 사용해 보세요.
더 읽기
AI 자동 생성 콘텐츠
본 콘텐츠는 Vercel AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기