DeepSeek V4 7월 중순 공식 출시 — 피크 시간대 API 가격 2배 인상
요약
DeepSeek가 7월 중순 V4 출시와 함께 업계 최초로 피크/오프피크(Peak/Off-Peak) API 과금 체계를 도입합니다. 혼잡 시간대에는 가격이 2배로 인상되며, 이는 AI 추론 리소스를 전기나 클라우드처럼 동적 자원으로 관리하려는 시도로 풀이됩니다.
핵심 포인트
- DeepSeek V4 출시 및 피크 시간대 API 가격 2배 인상 발표
- LLM 업계 최초로 수요 기반 동적 가격 책정 시스템 도입
- 피크 시간대 이용 시 비용이 2배 발생하므로 오프피크 활용 권장
- 경쟁사 대비 여전히 저렴한 가격 경쟁력 유지
DeepSeek V4 7월 중 중순 공식 출시 — 피크 시간대 API 가격 2배 인상
작성자: Nokka (นก-กา) | 2026년 7월 1일
뉴스 요약
DeepSeek는 이번 7월 중순에 DeepSeek V4 공식 버전을 출시할 예정이라고 발표함과 동시에, 대대적인 API 가격 체계 변경을 함께 발표했습니다. 이 회사는 LLM 업계 최초로 Peak/Off-Peak(피크/오프피크) 과금 시스템을 도입합니다. 혼잡 시간대(베이징 시간 기준 09:00-12:00 및 14:00-18:00)에는 API 가격이 일반 가격의 2배로 인상됩니다.
이는 대형 LLM 제공업체가 이러한 가격 체계를 도입한 첫 번째 사례입니다.
가격 상세 정보
일반 시간대(Off-Peak) 가격은 DeepSeek V4가 발표한 기존 가격과 동일하게 유지되지만, 피크 시간대(Peak)에는 2배가 적용됩니다. DeepSeek V4 Pro의 예시는 다음과 같습니다:
| 항목 | Off-Peak (일반 가격) | Peak (x2) |
|---|---|---|
| Input (Cache Hit) | 0.025 위안/백만 tokens | 0.05 위안/백만 tokens |
| ... |
DeepSeek V4 Flash의 경우, 피크 시간대 가격은 백만 tokens당 0.04 위안 (Cache Hit), 2 위안 (Cache Miss), 4 위안 (Output)입니다 [1].
경쟁사와의 비교
Input당 2.5 달러/백만 tokens, Output당 10 달러/백만 tokens를 책정하는 OpenAI GPT-4o 또는 Input당 5 달러/백만 tokens, Output당 25 달러/백만 tokens를 책정하는 Claude Opus 4.8과 비교했을 때 [4], DeepSeek V4 Pro는 피크 시간대임에도 불구하고 여전히 훨씬 저렴합니다.
계산 예시
고객을 위한 챗봇(chatbot)을 구축하기 위해 DeepSeek V4 Pro를 사용한다고 가정해 보겠습니다. 하루에 100,000개의 요청(requests)이 발생하고, 각 요청당 Input 2,000 tokens와 Output 500 tokens를 사용한다고 할 때, 피크 시간대에 작업하면 백만 tokens당 18 위안을 지불하게 되며, 100,000개의 요청 총합은 1,800 위안(~9,000 바트)이 됩니다. 하지만 오프피크(Off-Peak) 시간대로 옮기면 900 위안(~4,500 바트)으로 줄어듭니다. 비용을 절반으로 절약할 수 있습니다.
DeepSeek는 왜 이 시스템으로 전환하는가?
이러한 변화는 AI 추론 (inference)이 전기나 클라우드 컴퓨팅 (cloud computing)과 유사하게 사용 시간에 따라 비용이 변동되는 자원으로 간주되기 시작했음을 반영합니다. 동시에 많은 사용자가 호출할수록 단위당 비용은 더 높아집니다. 이는 AI 업계에 도입되고 있는 동적 리소스 관리 (dynamic resource management) 개념입니다.
제 관점에서는 이것이 AI API가 AWS, Azure, Google Cloud가 오랫동안 해온 방식처럼, 부하 분산을 위해 수요에 따라 가격을 책정하는 "지능형 리소스 관리 (intelligent resource management)" 시대로, 기존의 "단일 가격 (one-price-fits-all)" 시대에서 전환되고 있다는 신호라고 봅니다.
DeepSeek는 이번 가격 조정이 서비스의 안정성을 유지하고, 사용자들이 긴급하지 않은 작업을 오프피크 (Off-Peak) 시간대로 옮기도록 유도하여 전반적인 혼잡 (congestion)을 줄이는 데 도움이 될 것이라고 설명했습니다 [2].
DeepSeek V4 공식 버전에는 무엇이 새로운가?
DeepSeek V4는 2026년 4월부터 프리뷰 (Preview) 버전으로 출시되었으며, OpenRouter에서 6주 연속 세계에서 가장 많이 호출되는 API 모델이 되었습니다. 이 정도의 인기는 서비스 제공 비용에 대한 압박을 가할 수밖에 없습니다 [3].
이번 7월 중순에 출시될 공식 버전에는 다음과 같은 기능이 포함됩니다:
- 토큰 압축 (token compression) 수준에서 작동하는 새로운 어텐션 (Attention) 메커니즘이 DeepSeek Sparse Attention (DSA)과 결합되어, 기존 방식에 비해 연산 (compute) 및 메모리 (memory) 사용량을 줄여줍니다.
- 100만 토큰 컨텍스트 윈도우 (context window)가 모든 서비스 등급의 표준이 됩니다.
- 에이전트 기반 작업 실행 (agent-based task execution), 수학적 추론 (mathematical reasoning) 및 코드 생성 (code generation) 측면에서 향상된 성능을 제공합니다 [4].
개발자들의 반응
이 소식은 개발자들 사이에서, 특히 Weibo와 Zhihu에서 큰 화제가 되었습니다. 이유를 이해하는 사람들도 있는 반면, 특히 DeepSeek API에 의존하여 서비스를 제공하는 스타트업들은 비용 상승을 우려하고 있습니다.
한 사용자는 "토큰이 마치 전기처럼 변하고 있다. 사용자가 많을 때는 비싸지고, 사용자가 적을 때는 저렴해지는 자원이 되고 있다"라고 비교했습니다 [3].
하지만 다른 관점도 존재합니다. 일부 개발자들은 DeepSeek가 특히 모델의 인기가 가장 높은 시기에 높은 GPU 비용을 부담해야 하므로, 이것이 합리적인 비즈니스 전략이라고 보고 있습니다. 피크/오프피크 (Peak/Off-Peak) 가격 책정은 DeepSeek가 서비스 품질을 낮추지 않으면서도 리소스를 더 효율적으로 관리할 수 있게 해줍니다. 이러한 변화는 성장하는 시장의 자연스러운 현상임을 인정합니다.
반대하는 측에서는 이러한 방식의 가격 인상이 개발자들로 하여금 오픈 소스 (open source) 모델을 직접 배포하거나, 아직 피크 가격제 (Peak pricing)를 도입하지 않은 다른 제공업체로 눈을 돌리게 만드는 동기가 될 수 있다고 봅니다. 이는 DeepSeek가 관리해야 할 리스크이기도 합니다. 사용자의 행동을 변화시키는 것은 쉽지 않으며, 특히 경쟁자가 기다리고 있을 때는 더욱 그렇습니다.
DeepSeek는 가격 변경이 적용되기 24시간 전에 사용자에게 사전 통지할 것을 확인했습니다 [4]
Nokka의 관점
제 관점에서는 이번 변화를 예측하는 것이 어렵지 않습니다. DeepSeek V4가 세계에서 가장 많이 호출되는 모델이 됨에 따라, 서비스 비용 또한 당연히 상승하게 됩니다. 특히 많은 사용자가 동시에 접속하는 시간대에는 더욱 그렇습니다.
DeepSeek는 "제한"하기보다는 "유도"하는 흥미로운 접근 방식을 선택했습니다. 서비스 품질을 낮추거나 요청 (request) 수를 제한하는 대신, 가격 메커니즘을 사용하여 부하를 분산시키는 방식을 택했습니다. 이는 더 투명하고 공정하며 접근 방식입니다.
DeepSeek API를 사용하는 태국 개발자들의 경우, 중국의 피크 시간대(베이징 시간 기준 09:00-12:00 및 14:00-18:00)는 태국 시간으로 08:00-11:00 및 13:00-17:00에 해당하며, 이는 딱 업무 시간과 일치합니다.
비용을 절감하기 위해 가능하다면 배치 처리 (batch processing) 또는 비실시간 작업 (non-real-time tasks)을 이 시간대 외로 옮기는 것을 고려해 보십시오. 먼저 자신의 사용 패턴을 분석하는 것부터 시작하십시오.
또 다른 대안은 작업에 최고 수준의 정확도가 필요하지 않다면 V4 Pro 대신 DeepSeek V4 Flash를 사용하는 것입니다. Flash는 가격이 거의 3배 더 저렴하면서도 일반적인 작업에서 좋은 성능을 보여줍니다.
또는 비용을 확실하게 통제하고 싶다면, Qwen, Yi 또는 이전 버전의 DeepSeek와 같은 오픈 소스 (open source) 모델을 연구하여 태국의 클라우드 (cloud)에 직접 배포 (deploy)하는 것을 고려해 보십시오. 사용량이 많다면 장기적으로 더 경제적일 수 있습니다. 피크 가격제 (Peak pricing)가 적용되기 전에 미리 사용 계획을 세워야 합니다.
참고 문헌
참고 문헌
[1] Pandaily — DeepSeek V4 공식 버전 7월 중순 출시 및 피크 시간대 API 가격 두 배 인상 (2026년 6월 30일)
[2] TechNode — DeepSeek, 새로운 피크 시간대 API 가격과 함께 V4를 7월 중순에 출시할 예정 (2026년 6월 30일)
[3] Digitimes — DeepSeek V4, 중국의 LLM 가격 전쟁을 넘어 유틸리티 스타일 AI 가격 책정 도입 (2026년 7월 1일)
[4] IT之家 — DeepSeek V4 공식 버전 발표, 7월 중순 출시 및 피크 시간대 API 가격 두 배 인상 (2026년 6월 29일)
[5] DeepSeek API Docs — 모델 및 가격 책정
이 기사는 AI(DeepSeek V4 Flash)가 Hermes Agent를 통해 작성했으며, Nokka (นก-กา)에 의해 인간의 통제와 검토를 거쳤습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기