본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 17. 21:02

2026-06-17 다이제스트 (Digest)

요약

NVIDIA, MoonshotAI, DeepSeek 등 주요 AI 모델 제공사들의 API 가격 변동 사항을 정리한 다이제스트입니다. 모델별 프롬프트 및 생성 토큰 비용 변화와 신규 모델 출시 정보를 포함하고 있습니다.

핵심 포인트

  • NVIDIA Nemotron 3 Ultra의 생성 비용 인하로 장문 생성 워크로드 비용 절감
  • DeepSeek V4 Flash의 프롬프트 및 생성 가격 인하로 저비용 추론 가능
  • Z.ai GLM 5.2 출시로 1M 이상의 초장문 컨텍스트 지원 모델 확보
  • inclusionAI, IBM, Meta 모델이 현재 가장 저렴한 토큰 가격 제공

2026-06-17 다이제스트 (Digest)

가장 영향력 있는 변화

  • NVIDIA: Nemotron 3 Ultra – 생성 (completion) 가격이 $2.50/1M에서 $2.20/1M로 하락했습니다 (프롬프트 (prompt) 가격은 $0.50/1M로 동일). 관심 대상: 출력 토큰 (output tokens)이 비용의 대부분을 차지하는 장문 생성 (long-form generation) 워크로드를 실행하는 팀.

기타 가격 변동

  • MoonshotAI: Kimi K2.7 Code – 프롬프트 (prompt) 가격이 $0.75/1M → $0.74/1M로 인하되었습니다 (-$0.01/1M). 생성 (completion) 가격은 $3.50/1M로 유지되었습니다.

    관심 대상: 코드 어시스턴트 (code-assistant) 프롬프트의 입력 토큰 (input token) 비용에 민감한 개발자.

  • DeepSeek: DeepSeek V4 Flash – 프롬프트 (prompt) 가격이 $0.098/1M → $0.090/1M로 인하되었습니다 (-$0.008/1M). 생성 (completion) 가격은 $0.196/1M → $0.180/1M로 인하되었습니다 (-$0.016/1M).

    관심 대상: 저지연 (low-latency), 저비용 생성 (completions)을 원하는 플래시 모드 (flash-mode) 추론 (inference) 사용자.

신규 모델 추가

  • Z.ai: GLM 5.2 – 1,048,576 토큰 컨텍스트 (context); 프롬프트 (prompt) $1.40/1M, 생성 (completion) $4.40/1M. 관심 대상: 중간에서 높은 수준의 생성 비용 (generation cost)과 함께 매우 긴 컨텍스트 (long context)가 필요한 애플리케이션.

현재 가장 저렴한 모델 (1M 토큰당)

  1. inclusionAI: Ling-2.6-flash – 프롬프트 (prompt) $0.01/1M, 생성 (completion) $0.03/1M
  2. IBM: Granite 4.0 Micro – 프롬프트 (prompt) $0.017/1M, 생성 (completion) $0.112/1M
  3. Meta: Llama 3.1 8B Instruct – 프롬프트 (prompt) $0.02/1M, 생성 (completion) $0.03/1M

추적 중인 총 모델 수: 337개.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0