DeepSeek V4 Flash, 6주 연속 글로벌 호출량 1위 기록: 중국산 대규모 언어 모델(LLM)이 정말 승리했는가?

요약

DeepSeek V4 Flash가 글로벌 LLM 호출량 1위를 기록하며 중국산 모델의 약진을 증명했습니다. 저렴한 비용과 높은 가성비를 앞세운 중국 모델들이 시장 점유율을 높이는 가운데, 기술적 우위와 비즈니스 모델의 변화가 가속화되고 있습니다.

핵심 포인트

DeepSeek V4 Flash가 3주 연속 글로벌 LLM 호출량 1위 달성
상위 4개 모델 모두 중국산 모델로, 미국 모델을 압도
중국 모델의 강점은 압도적인 가성비와 오픈소스 생태계
모델 성능(추론 능력)과 호출량(가성비) 사이의 격차는 여전히 존재
AI 모델 수익 모델이 기술 우위에서 서비스 및 인프라로 변화 중

6월 첫째 주, 글로벌 AI 대규모 언어 모델(LLM) 호출량이 36.1조 토큰(Token)에 달하다

OpenRouter가 발표한 최신 데이터가 나왔습니다. 6월 1일부터 7일까지 글로벌 AI 대규모 언어 모델(LLM)의 총 호출량은 36.1조 토큰(Token)으로, 전주 대비 13.5% 증가하며 7주 연속 상승세를 기록했습니다.

1위는 DeepSeek-V4-Flash입니다. 3.69조 토큰(Token)을 기록하며 전주 대비 19% 성장했고, 3주 연속 1위를 차지했습니다.

상위 4개 모델은 모두 중국산 모델입니다: DeepSeek V4 Flash, 腾讯(Tencent) Hunyuan Hy3, 阿里(Alibaba) Qwen3.5, 字节(ByteDance) Doubao 2.0 Pro. 미국의 모델들은 5위 밖으로 밀려났습니다.

이것은 우연이 아니다

DeepSeek V4 Flash는 도대체 어떤 정체일까요? Flash 접미사의 의미는 "경량 고속 버전"입니다. 더 적은 연산 자원(Computing Power)을 사용하여 풀 버전(Full version)에 가까운 성능을 내며, 비용은 풀 버전의 1/10 수준입니다.

개발자들은 행동으로 투표하고 있습니다. Flash 버전 API는 가격이 저렴하고, 응답 속도가 빠르며, 중국어 이해도가 높습니다. AI 애플리케이션을 만드는 스타트업들이 계산해 본 결과: DeepSeek V4 Flash를 사용하면 한 달 API 비용을 2만 달러에서 2,000달러까지 낮출 수 있습니다.

腾讯(Tencent) Hunyuan Hy3가 2위를 차지한 것은 WeChat 생태계 덕분입니다. 수많은 미니 프로그램(Mini Program)과 공식 계정(Official Account)의 배후에는 Hunyuan API가 연결되어 있어 호출량이 자연스럽게 많습니다.

阿里(Alibaba) Qwen3.5가 3위를 차지한 데에는 오픈소스 커뮤니티의 공이 큽니다. HuggingFace에서 Qwen 모델의 다운로드 수는 이미 Meta의 Llama를 넘어섰습니다.

하지만 "호출량 1위"가 "최고"를 의미하지는 않는다

분명히 짚고 넘어가야 합니다. 호출량이 많은 것은 저렴하기 때문일 수 있으며, 반드시 사용성이 좋기 때문은 아닙니다.

저는 DeepSeek V4 Flash로 코드를 작성해 보기도 했고, Claude 4로도 작성해 보았습니다. 결론은: DeepSeek는 Python과 JavaScript를 작성할 때 확실히 유용하지만, 복잡한 시스템 설계나 다중 파일 리팩토링(Refactoring)에서는 Claude 4가 여전히 더 안정적입니다.

호출량은 하나의 차원일 뿐이며, 코드 품질, 추론 깊이, 멀티모달(Multimodal) 능력은 또 다른 차원입니다. 중국산 모델은 "가성비" 차원에서는 승리했지만, "최정상급 능력" 차원에서는 여전히 추격 중입니다.

미국의 반격은 어디에서 올 것인가?

OpenAI는 아직 움직이지 않았습니다. GPT-5.5가 내부 테스트 중이라는 소문이 있으며, 성능은 GPT-5의 3배에 달한다고 합니다. Google의 Gemini 4.0 역시 준비 중입니다.

하지만 DeepSeek는 한 가지 사실을 증명했습니다: 오픈소스와 가성비의 조합은 폐쇄형 상용 모델(Closed-source commercial models)의 리듬을 깨뜨릴 수 있다는 것입니다. 과거 OpenAI는 기술적 우위를 바탕으로 높은 가격을 책정할 수 있었지만, 이제는 아닙니다. 개발자들에게는 무료(또는 무료에 가까운) 대체제가 있는데, 왜 굳이 돈을 지불하겠습니까?

이것이 바로 젠슨 황(Jensen Huang)이 말한 "소프트웨어 회사가 AI 통행료 징수소로 변해야 한다"는 배경입니다. 모델 자체로 돈을 벌 수 없다면, 다른 단계에서 수익을 창출해야 합니다. Microsoft는 Azure를 통해 DeepSeek 트래픽으로 수익을 얻고 있고, Anthropic은 기업 구독을 통해 수익을 얻고 있습니다. DeepSeek는... 아직 알 수 없습니다.

일반 개발자들에게 어떤 의미인가?

매우 간단합니다. 2026년 하반기, AI 애플리케이션의 창업 비용은 전례 없이 낮아질 것입니다.

여러분은 DeepSeek V4 Flash를 메인 모델로 사용하고, Hunyuan Hy3를 중국어 윤문(Polishing)에 사용하며, Qwen3.5를 다국어 번역에 사용할 수 있습니다. 이 세 모델의 API 비용을 모두 합쳐도 Claude 4를 단 한 번 사용하는 비용보다 저렴할 수 있습니다.

하지만 명확히 생각해야 합니다: 만약 모든 사람이 저렴한 모델로 비슷한 AI 애플리케이션을 만들 수 있다면, 여러분의 경쟁 장벽(Competitive Barrier)은 어디에 있습니까?

호출량 데이터는 속일 수 있어도, 이 질문은 속일 수 없습니다.

（본문은 OpenRouter 2026년 6월 공개 데이터를 기반으로 작성되었습니다. 전재 시 출처를 밝혀주시기 바랍니다.）

본문은 WDSEGA 블로그에 최초 게시되었으며, 더 많은 AI/개발/SF 콘텐츠를 원하시면 방문해 주세요.

AI 자동 생성 콘텐츠

원문 바로가기