2026-06-17 다이제스트 (Digest)
요약
NVIDIA, MoonshotAI, DeepSeek 등 주요 AI 모델 제공사들의 API 가격 변동 사항을 정리한 다이제스트입니다. 모델별 프롬프트 및 생성 토큰 비용 변화와 신규 모델 출시 정보를 포함하고 있습니다.
핵심 포인트
- NVIDIA Nemotron 3 Ultra의 생성 비용 인하로 장문 생성 워크로드 비용 절감
- DeepSeek V4 Flash의 프롬프트 및 생성 가격 인하로 저비용 추론 가능
- Z.ai GLM 5.2 출시로 1M 이상의 초장문 컨텍스트 지원 모델 확보
- inclusionAI, IBM, Meta 모델이 현재 가장 저렴한 토큰 가격 제공
2026-06-17 다이제스트 (Digest)
가장 영향력 있는 변화
- NVIDIA: Nemotron 3 Ultra – 생성 (completion) 가격이 $2.50/1M에서 $2.20/1M로 하락했습니다 (프롬프트 (prompt) 가격은 $0.50/1M로 동일). 관심 대상: 출력 토큰 (output tokens)이 비용의 대부분을 차지하는 장문 생성 (long-form generation) 워크로드를 실행하는 팀.
기타 가격 변동
-
MoonshotAI: Kimi K2.7 Code – 프롬프트 (prompt) 가격이 $0.75/1M → $0.74/1M로 인하되었습니다 (-$0.01/1M). 생성 (completion) 가격은 $3.50/1M로 유지되었습니다.
관심 대상: 코드 어시스턴트 (code-assistant) 프롬프트의 입력 토큰 (input token) 비용에 민감한 개발자.
-
DeepSeek: DeepSeek V4 Flash – 프롬프트 (prompt) 가격이 $0.098/1M → $0.090/1M로 인하되었습니다 (-$0.008/1M). 생성 (completion) 가격은 $0.196/1M → $0.180/1M로 인하되었습니다 (-$0.016/1M).
관심 대상: 저지연 (low-latency), 저비용 생성 (completions)을 원하는 플래시 모드 (flash-mode) 추론 (inference) 사용자.
신규 모델 추가
- Z.ai: GLM 5.2 – 1,048,576 토큰 컨텍스트 (context); 프롬프트 (prompt) $1.40/1M, 생성 (completion) $4.40/1M. 관심 대상: 중간에서 높은 수준의 생성 비용 (generation cost)과 함께 매우 긴 컨텍스트 (long context)가 필요한 애플리케이션.
현재 가장 저렴한 모델 (1M 토큰당)
- inclusionAI: Ling-2.6-flash – 프롬프트 (prompt) $0.01/1M, 생성 (completion) $0.03/1M
- IBM: Granite 4.0 Micro – 프롬프트 (prompt) $0.017/1M, 생성 (completion) $0.112/1M
- Meta: Llama 3.1 8B Instruct – 프롬프트 (prompt) $0.02/1M, 생성 (completion) $0.03/1M
추적 중인 총 모델 수: 337개.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기