The Token Ledger Digest – 2026-06-02
요약
주요 AI 모델들의 토큰 가격 변동 및 서비스 종료 현황을 정리한 리포트입니다. Qwen3와 DeepSeek의 가격 인하와 Baidu, Google 모델의 서비스 종료 소식을 다룹니다.
핵심 포인트
- Qwen3 30B의 프롬프트 및 완료 비용 약 42~43% 대폭 인하
- DeepSeek V3 및 V3.2의 토큰 가격 완만한 하락세
- Baidu ERNIE 4.5 및 Google Gemini 2.0 Flash 계열 모델 서비스 종료
- 모델별 가격 변동에 따른 비용 최적화 및 마이그레이션 필요성
The Token Ledger Digest – 2026-06-02
가장 영향력 있는 변화
- Qwen: Qwen3 30B A3B Instruct 2507 – 프롬프트 (Prompt) 가격이 $0.0900에서 $0.0428 /1M 토큰으로 하락하였으며, 완료 (Completion) 가격은 $0.3000에서 $0.1716 /1M 토큰으로 하락했습니다. 관련 대상: 이 모델을 사용하여 비용 민감형 추론 (Inference)을 수행하는 팀은 프롬프트 비용 약 42%, 완료 비용 약 43% 절감 효과를 볼 수 있습니다.
가격 변동 사항
- Tencent: Hy3 preview – 프롬프트 (Prompt) $0.0660 → $0.0630 /1M; 완료 (Completion) $0.2600 → $0.2100 /1M. 관련 대상: Hy3 preview 사용자들은 프롬프트와 완료 비용 모두에서 소폭의 절감 혜택을 누릴 수 있습니다.
- MiniMax: MiniMax M2.7 – 프롬프트 (Prompt) $0.2600 → $0.2790 /M (↑$0.0190); 완료 (Completion)는 $1.2000 /1M로 변동 없음. 관련 대상: 프롬프트 비용이 약간 상승하였으나, 완료 비용은 안정적입니다.
- DeepSeek: DeepSeek V3.2 – 프롬프트 (Prompt) $0.2520 → $0.2288 /1M; 완료 (Completion) $0.3780 → $0.3432 /1M. 관련 대상: 프롬프트와 완료 비용 모두에서 완만한 감소가 있었습니다.
- DeepSeek: DeepSeek V3 – 프롬프트 (Prompt) $0.2288 → $0.2002 /1M; 완료 (Completion) $0.9144 → $0.8001 /1M. 관련 대상: 채팅 워크로드 (Chat workloads)에 대해 주목할 만한 완료 비용 하락(~12%)이 있었습니다.
제거된 모델
- Baidu: ERNIE 4.5 300B A47B – 더 이상 사용할 수 없음; 이전 가격은 프롬프트 (Prompt) $0.2800 /1M, 완료 (Completion) $1.1000 /1M였습니다. 관련 대상: 이 대규모 Baidu 모델이 필요한 사용자들은 대안으로 마이그레이션 (Migrate)해야 합니다.
- Google: Gemini 2.0 Flash Lite – 제거됨; 이전 가격은 프롬프트 (Prompt) $0.0750 /1M, 완료 (Completion) $0.3000 /1M였습니다. 관련 대상: 이 저지연 (Low-latency) 모델에 의존하는 애플리케이션은 교체가 필요합니다.
- Google: Gemini 2.0 Flash – 제거됨; 이전 가격은 프롬프트 (Prompt) $0.1000 /1M, 완료 (Completion) $0.4000 /1M였습니다. 관련 대상: 표준 Flash 모델 사용자는 제공업체 목록을 조정해야 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기