토큰 원장 (The Token Ledger) – 2026-07-02
요약
주요 AI 모델들의 토큰 가격 변동 사항을 정리한 보고서입니다. Qwen 모델의 급격한 가격 인상과 DeepSeek의 가격 인하 등 모델별 비용 변화를 다룹니다.
핵심 포인트
- Qwen3 30B 모델의 완료 가격이 약 4배 인상되어 예산 재검토 필요
- DeepSeek V4 Flash의 가격 인하로 대량 추론 비용 절감 가능
- MiniMax 및 Qwen 시리즈 전반의 가격 상승세 확인
- inclusionAI, IBM Granite, Meta Llama 3.1이 현재 가장 저렴한 모델로 분류됨
토큰 원장 (The Token Ledger) – 2026-07-02
가장 비용 영향이 큰 변화: Qwen Qwen3 30B A3B Thinking 2507의 완료 (completion) 가격이 1M 토큰당 $0.40에서 $1.56로 인상되었습니다 (+$1.16). 이 모델을 장문 생성 (long-form generation)에 사용하는 개발자들은 예산 할당을 재검토해야 합니다.
가격 변동 사항
- DeepSeek V4 Flash – 프롬프트 (Prompt) 가격이 $0.098 → $0.089/1M (-$0.009)로 하락; 완료 (completion) 가격이 $0.196 → $0.18/1M (-$0.016)로 하락했습니다. 관련 대상: 대량의 추론 (inference)을 실행하는 팀은 프롬프트 비용의 약 0.5%, 완료 비용의 약 8%를 절감할 수 있습니다.
- MiniMax M2.1 – 프롬프트 가격이 $0.29 → $0.30/1M (+$0.01)로 상승; 완료 가격이 $0.95 → $1.20/1M (+$0.25)로 상승했습니다. 관련 대상: 이 모델을 사용하는 사용자는 완료 비용이 26% 증가하는 것을 경험하게 됩니다.
- MiniMax M2 – 프롬프트 가격은 $0.255/1M로 변동 없음; 완료 가격이 $1.00 → $1.02/1M (+$0.02)로 상승했습니다. 관련 대상: 완료 작업 중심의 워크로드에 대해 2%의 미미한 인상이 있습니다.
- Qwen Qwen3 30B A3B Thinking 2507 – 프롬프트 가격이 $0.08 → $0.13/1M (+$0.05)로 상승; 완료 가격이 $0.40 → $1.56/1M (+$1.16)로 상승했습니다. 관련 대상: 완료 비용이 거의 4배로 증가했습니다; 토큰 집약적 (token-intensive) 작업에 대해 대안을 고려하십시오.
- Qwen Qwen3 8B – 프롬프트 가격이 $0.05 → $0.117/1M (+$0.067)로 상승; 완료 가격이 $0.40 → $0.455/1M (+$0.055)로 상승했습니다. 관련 대상: 프롬프트와 완료 비용이 모두 약 13~14% 상승했습니다.
- DeepSeek Chat V3 0324 – 프롬프트 가격이 $0.20 → $0.24/1M (+$0.04)로 상승; 완료 가격이 $0.77 → $0.90/1M (+$0.13)로 상승했습니다. 관련 대상: 완료 비용은 약 17%, 프롬프트 비용은 20% 상승했습니다.
현재 가장 저렴한 모델 (1M 토큰당)
- inclusionAI Ling-2.6-flash – 프롬프트 $0.01, 완료 $0.03
- IBM Granite 4.0 Micro – 프롬프트 $0.017, 완료 $0.112
- Meta Llama 3.1 8B Instruct – 프롬프트 $0.02, 완료 $0.03
오늘 추가되거나 제거된 모델은 없습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기