DeepSeek R2의 정체는 SEO 블로그! 소문의 실체·Huawei 실패·V4의 실력을 철저 해설

📺 이 기사는 YouTube 채 채널 きなこもっちーのテック深掘り의 영상 해설 기사입니다.

▶️ 영상은 이쪽으로 → DeepSeek R2의 정체는 SEO 블로그! 소문의 실체·Huawei 실패·V4의 실력을 철저 해설

🐹🦜 이 기사에 등장하는 두 마리

🐹
もっちー (햄스터)… AI는 아직 공부 중. "그게 무슨 뜻이야?"라고 소박하게 질문하는 학생 역할
🦜
きなこ (사랑앵무)… AI로 조사를 수행하는 해설 역할. 친절하게 깊이 있게 가르쳐 주는 선생님 역할

이 기사는 두 마리의 대화를 받아 적은 형식입니다. 발언 맨 앞에 있는 이모지+이름이 화자입니다.

🐹 もっちー「있잖아 きなこ! DeepSeek R2가 32B 모델로 저렴하고 강력하다는 게 정말이야? RTX 4090에서 돌아가고 AIME 92.7%를 달성했다는 소문 때문에 AI 커뮤니티가 엄청 떠들썩하던데!"

🦜 きなこ「응, 정말 화제가 되고 있지. 하지만 사실…… 그 R2, 공식 릴리스(release)가 존재하지 않아."

🐹 もっちー「에……? 그렇게 X(구 Twitter)도 뉴스도 떠들썩했는데, 릴리스되지 않았다니 그게 무슨 소리야? 구체적인 사양까지 적혀 있었는데……"

🦜 きなこ「2026년 4월 시점에서, DeepSeek의 HuggingFace 리포지토리(repository)에 R2라는 이름의 모델은 존재하지 않아. V4-Pro와 V4-Flash는 실재하지만, R2는 보이지 않아."

🐹 もっちー「그럼 「32B Dense, RTX 4090에서 구동, AIME 92.7%」라는 사양은 어디서 나온 거야? 그렇게 구체적인 숫자까지 나왔는데……"

🦜 きなこ「그게 바로 오늘의 핵심이야. 소문의 출처를 추적해 갔더니, 충격적인 사실을 알게 되었어."

🦜 きなこ「이 영상에서는 R2 소문의 정체·Huawei Ascend에서의 훈련 실패의 진상·실제로 릴리스된 V4의 실력까지, DeepSeek R2 논쟁의 전모를 해설해 줄게."

🐹 もっちー「R2는 대체 누가, 어디서 만들어낸 이야기야? 그걸 알고 싶어!"

🦜 きなこ「소문의 기점이 된 것은 decodethefuture.org라는 SEO 블로그였어. 공식적인 뒷받침은 전혀 없었지만, 거기에 적힌 사양이 X에서 확산되어 세계적인 트렌드가 된 거야."

🐹 もっちー「SEO 블로그 하나가 전 세계 AI 커뮤니티를 움직였다는 거야? 그거 무섭지 않아……? 제대로 된 리포지토리나 공식 정보를 확인했으면 좋았을 텐데."

🦜 きなこ「맞아, 1차 소스(primary source) 확인은 정말 중요해. 이건 정보 리터러시(information literacy)의 문제이기도 하지. 그럼 실제로 무슨 일이 일어났는지 자세히 살펴볼게."

🦜 きなこ「「DeepSeek R2는 32B Dense, AIME 92.7%, MIT 수준의 성능, RTX 4090에서 구동된다」라는 R2의 사양을 보도한 출처를 조사하면?"

🦜 きなこ「decodethefuture.org라는 SEO 블로그 기사에 도달하게 돼. 그리고 그 사이트는 어디에서 정보를 가져오느냐 하면…"

🐹 もっちー「decodethefuture.org…… 들어본 적 없어. 그곳은 신뢰할 수 있는 정보 사이트야?"

🦜 きなこ「그게 말이야, DeepSeek 공식도 arXiv도 Reuters·TechCrunch도 아니야. 검색 엔진에 최적화된 SEO 블로그야."

🦜 きなこ「DeepSeek 공식의 수억 개의 토큰(token) 훈련 데이터에는 「R2의 사양」 같은 글자는 단 한 글자도 나오지 않아."

🐹 もっちー「에, 그럼 인터넷 소문이 제멋대로 퍼져 나갔다는 거야?! 소스가 어디냐고! 그렇게 구체적인 숫자까지 있었는데!"

🦜 きなこ「게다가 더 재미있는 사실이 있어. 여러 사이트가 각자 「R2의 사양」을 보도하고 있는데, 그 내용이 서로 모순되고 있어."

🐹 もっちー「모순? 어떤 모순이 있어?"

🦜 きなこ「한쪽 사이트는 「32B Dense 모델」이라고 주장하고, 다른 사이트는 「sparse MoE 아키텍처 (architecture)」라고 말해. Dense와 MoE는 근본적으로 다른 구조이기 때문에, 같은 모델을 가리킬 리가 없거든."

🐹 もっちー「그건…… 모두가 같은 소스를 인용한 게 아니라, 각자가 독자적으로 R2의 사양을 만들어냈다는 뜻이야?"

🦜 きなこ「바로 그거야. 「R2가 온다!」라는 기대감이 먼저 있고, 사양은 나중에 상상과 추측으로 채워진 느낌이지. 예측 시장에서도 「R2 릴리스」 가능성은 제로에 가깝다고 판정되었어."

🐹 もっちー「무섭네…… 하지만 왜 그런 소문이 전 세계로 퍼진 거야?"

🦜 키나코「DeepSeek가 V3나 R1에서 실제로 엄청난 성과를 냈기 때문에, 『다음 R2는 훨씬 더 대단할 것』이라는 기대가 증폭된 거야. 신뢰할 수 있는 실적이 있으면 소문도 믿기 쉬워지거든.」

🐹 못치「그럼 DeepSeek는 실제로 무엇을 출시했어? R2가 없다면, 진짜 신모델은 뭐야?」

🦜 키나코「DeepSeek가 2026년 4월에 발표한 것은 DeepSeek-V4야. 파라미터(Parameter) 총수 1.6조, 액티브(Active) 490억 개의 MoE (Mixture of Experts) 모델이지.」

🐹 못치「1.6조 파라미터라니 천문학적인 숫자인데, 정말 그런 모델이 실제로 돌아가고 API로 쓸 수 있는 거야? 그걸 돌리려면 컴퓨터가 얼마나 필요해?」

🦜 키나코「돌아가고, 그것도 아주 강력해. LiveCodeBench에서 93.5, Codeforces 레이팅 3206을 기록했거든. 코딩 계열 벤치마크에서는 탑클래스 수치야.」

🐹 못치「그런데 말이야, 얼마 전부터 『R1-Distill-32B가 R2가 아닐까』라는 이야기가 있었는데, 실제로는 어떤 관계야? 이름에 32B가 붙어 있어서 혼동된 거야?」

🦜 키나코「그게 바로 R2 신화가 혼동된 근원이야. R1-Distill-Qwen-32B는 2025년 1월에 공개된 실재 모델인데, 이름에 『32B』가 들어있다 보니 『이게 R2인가?』 하는 오해를 불러일으킨 거지.」

🐹 못치「그렇구나! R1을 압축한 증류(Distillation) 모델이 32B이고, 그것이 R2의 『32B Dense』라는 구체적인 소문의 베이스가 되었다는 거야? 하지만 증류 모델과 새로운 아키텍처(Architecture)는 근본적으로 다르잖아?」

🦜 키나코「맞아. 실재하는 『R1-Distill-Qwen-32B』에 『R2』라는 라벨을 붙여서, 존재하지 않는 사양이 증폭되어 간 거야.」

🐹 못치「잠깐만, 그럼 왜 R2는 이렇게 늦어지는 거야? V4가 출시되었는데도.」

🦜 키나코「거기에는 심각한 이유가 있어. 단순한 기술적 과제가 아니라, 지정학적 리스크가 기술 개발 로드맵에 직접 영향을 미친 이야기야. 다음에서 자세히 살펴볼게.」

🐹 못치「지정학이 기술 개발에 영향을 미친다니…… 왠지 스케일이 너무 커서 따라가기 힘든데, 그게 구체적으로 무슨 뜻이야?」

🦜 키나코「그 전에 『증류 (Distillation)』가 뭐냐고 생각했지? 큰 모델의 지식을 작은 모델로 옮겨 심는 기술을 말해.」

🦜 키나코「R1의 똑똑함을 Qwen-32B에 응축한 것이 R1-Distill이라 불리는 모델이야. '큰 것이 작은 것을 포괄한다'의 역버전이라고 할 수 있지!」

🦜 키나코「DeepSeek는 R2를 Huawei Ascend 910B로 훈련시키려 했어. 하지만 빈번하게 발생하는 크래시(Crash)와 불안정한 동작 때문에 훈련을 완수하지 못했지.」

🐹 못치「에, Huawei 칩을 쓰려다가 실패한 거야? 그거 상당히 힘들었겠는데……」

🦜 키나코「원인은 두 가지야. 첫 번째는 CANN—Huawei의 AI 소프트웨어 스택의 미성숙함. NVIDIA의 CUDA에 해당하는 것인데, 대규모 훈련에서의 안정성이 부족했어.」

🐹 못치「CANN은 GPU 프로그래밍 메커니즘을 말하는 거지? CUDA와 비교하면 어느 정도 차이가 나?」

🦜 키나코「생태계의 성숙도가 완전히 달라. CUDA는 NVIDIA가 15년 이상 걸쳐 다듬은 기술이라 딥러닝(Deep Learning) 프레임워크와의 호환성도 매우 높아. CANN은 아직 그 과정에 있는 단계야.」

🦜 키나코「두 번째 원인은 칩 간의 상호 연결 속도야. 대규모 MoE 모델의 훈련에서는 수천 개의 칩이 고속으로 통신해야 하는데, Ascend는 거기서 병목 현상(Bottleneck)이 발생했어.」

🐹 못치「그렇구나…… 그래서 R2의 훈련이 막혀버린 거구나.」

🦜 키나코「거기에 결정타를 날린 게 2025년 4월의 H20 GPU 수출 금지야. 미국이 NVIDIA에 대해 중국향 H20 출하를 금지한 거지.」

🐹 못치「더블 펀치네! Huawei로 실패하고, NVIDIA도 못 쓰고…… 그러니 늦어질 수밖에!」

🦜 키나코「DeepSeek가 취한 대책이 바로 『NVIDIA 훈련 · Huawei 추론』이라는 듀얼 트랙(Dual-track) 전략이야.」

🦜 키나코「훈련은 NVIDIA, 추론(실제 응답 생성)은 Huawei라는 역할 분담으로 수출 규제를 회피하고 있는 거지.」

🐹 못치「훈련과 추론에서 사용하는 칩을 나눈다는 뜻이야? 그거 똑똑하네.」

🦜 키나코「이렇게 해서 2025년 5월 예정이었던 R2 릴리스가 2026년 현재까지도 계속 늦어지고 있어. 하지만 말이야, 진짜 가성비 혁명은 R2가 아니라 훨씬 의외의 곳에 있었어.」

🦜 키나코 「"DeepSeek가 Western API보다 70% 저렴하다"는 말 들어본 적 있어? 실제 수치는 훨씬 더 드라마틱해.」

🐹 못치 「70% 저렴하다면 충분히 대단하다고 생각하지만, 더 드라마틱하다니 무슨 뜻이야? 1달러가 30센트가 된다는 뜻인데, 그것보다 더 저렴하다니 대체 어떤 규모의 이야기야?」

🦜 키나코 「V4-Flash의 요금은 입력 100만 토큰당 0.14달러, 출력 0.28달러야. Claude Sonnet 4.6과 비교하면 97% 저렴하고, Opus 4.7과 비교하면 98% 저렴해.」

🐹 못치 「70% 저렴하다고 들었는데 실제로는 97% 저렴하다고?! 그건 4배가 아니라 차원이 다르잖아! 계산이 잘못된 거 아냐?!」

🦜 키나코 「계산은 맞아. 70% 저렴하다는 건 3분의 1 가격이라는 뜻이고, 97% 저렴하다는 건 30분의 1 이상의 가격이라는 뜻이야. 완전히 다른 세상이지.」

🦜 키나코 「여기서 약간 기술적인 이야기를 하자면, MoE (Mixture of Experts) 아키텍처가 이 가성비를 뒷받침하고 있어. 1.6조 개의 파라미터(Parameter)를 전부 사용하는 게 아니라, 토큰마다 최적의 전문가인 490억 개만 골라서 사용하는 거야.」

🐹 못치 「그러니까 전원 출근하는 게 아니라, 프로젝트마다 최적의 전문가 팀만 불러오고 불필요한 사람은 대기시켜 두는 것 같은 시스템이라는 거지? 그게 비용 절감의 비밀이구나!」

🦜 키나코 「그 비유가 정확해. 1.6조 개 중 490억 개—약 3%의 파라미터만 활성화하는 효율화가 그 가격 설정을 가능하게 만든 거야.」

🐹 못치 「R2의 소문을 쫓는 동안, 현실의 V4가 훨씬 더 놀라운 기술을 구현하고 있었네.」

🐹 못치 「그런데 그렇게 대단한 기술을 DeepSeek가 오픈 소스(Open Source)로 공개하는 이유가 뭐야? 기업 전략으로서 이상하지 않아?」

🦜 키나코 「사실 거기에는 지정학적인 계산이 깔려 있어. 기술력을 세계에 공개함으로써 영향력을 넓히는 것—AI를 소프트 파워 (Soft Power)로 사용하는 전략이야.」

🐹 못치 「소프트 파워로서의 AI라…… 즉, 전 세계 개발자들이 DeepSeek를 사용하면 사용할수록 기술 생태계의 중심에 중국의 기술이 파고든다는 뜻이구나. 전략적으로 생각하고 있네.」

🦜 키나코 「DeepSeek의 CEO 량원펑(Liang Wenfeng)은 "오픈 소스는 문화적 실천이자 소프트 파워다"라고 발언했어. 단순한 기술 제공이 아니라 전략적인 의미가 있는 거지.」

🐹 못치 「어라, DeepSeek 써도 되는 거야? 정부 같은 곳은 못 쓴다고 들었는데…… 실제로 어디서 금지하고 있어? 일본은 어때?」

🦜 키나코 「미국에서는 연방 정부와 17개 이상의 주에서 정부 기기(Device)로부터 DeepSeek를 배제하고 있어. GDPR (개인정보보호법) 위반 우려로 EU에서도 규제 움직임이 있고, 이탈리아와 아일랜드에서도 조사가 시작되었어.」

🐹 못치 「17개 주 이상이라니 엄청 많잖아! 그럼 미국 전역에서 거의 못 쓰는 거나 다름없는 거 아냐?! EU에서도 규제라면 전 세계에서 퇴출당하고 있는 거 아냐?!」

🦜 키나코 「정부 기기에 한정된 이야기야. 민간이나 개인 차원에서는 각국에서 아직 사용할 수 있어. 일본은 METI (경제산업성)가 주의 환기 수준이지, 법적 규제까지는 가지 않았어.」

🐹 못치 「그럼 일본의 개인 개발자는 V4-Flash API를 평범하게 쓸 수 있다는 거지? 그건 꽤 고마운 일이네. 비용 97% 절감이라니, 작은 프로젝트라도 여유롭게 할 수 있는 규모잖아.」

🦜 키나코 「수익 측면에서 말하자면, V4-Flash의 97% 비용 절감은 일본의 개인 개발자에게도 상당히 커.」

🦜 키나코 「월 100만 토큰을 사용한다면, Claude에서 DeepSeek V4-Flash로 전환하는 것만으로도 월 AI 비용이 급감할 거야!」

🐹 못치 「기술과 거버넌스 (Governance) 사이의 트레이드오프 (Trade-off)라는 거네. 싸고 강력하지만 데이터 주권 문제가 있어. 기밀 데이터를 다루지 않는 프로젝트라면 충분히 괜찮은 선택지 아닐까.」

🦜 키나코 「API로 사용하는 한, 기술적인 이점을 누리면서 기밀성이 높은 데이터를 보내지 않는 방식이 일반적이야. 기술 선택과 데이터 관리를 분리해서 생각하는 것이 중요해.」

🐹 못치 「그러고 보니 HuggingFace에서도 중국발 모델이 늘어나고 있다고 들었는데…… DeepSeek뿐만이 아니라는 거야? Qwen이나 GLM 같은 것도 자주 보이게 됐지.」

🦜 키나코 「HuggingFace의 다운로드 수에서도 중국발 오픈 소스 모델이 미국 모델을 상회하는 경향이 나타나고 있어. Qwen, GLM, DeepSeek가 나란히 상위권에 진입하고 있는 느낌이야.」

🦜 키나코 「R2에 대한 소문이 전 세계를 휩쓸고 있는 동안, 실제 오픈 소스 (Open Source) AI 생태계는 착실히 성장하고 있었어. 소문보다 현실이 훨씬 더 흥미로운 전개를 보여주고 있었지.」

🐹 못치 「결국 R2가 대체 뭐였냐고 묻는다면, 『1차 소스(Primary Source)가 없는 소문이 존재하지 않는 모델을 만들어냈다』라고 말하면 되는 거야? 정보 리터러시 (Information Literacy)의 교과서 같은 사례네.」

🦜 키나코 「바로 그거야. R2에 대한 소문은 『없는 소매는 흔들 수 없다(없는 것을 만들어낼 수 없다)』였지만, 현실의 DeepSeek는 V4의 1.6조 MoE, 97% 이상의 가성비, Huawei 전략 실패와 수출 규제라는 드라마를 리얼하게 펼치고 있었거든.」

🦜 키나코 「기술적으로 정리하자면, MoE (Mixture of Experts) 아키텍처의 본질은 『모두가 매번 일할 필요가 없다』는 효율화에 있어. 1.6조 파라미터 (Parameter) 중 3%만 구동함으로써 고성능과 저비용을 동시에 달성하고 있는 거야.」

🐹 못치 「R2라는 환상을 쫓을 시간이 있었다면, 차라리 실제로 V4-Flash의 API를 써봤어야 했어! MoE로 97%나 저렴하면서 고성능이라니, 현실이 훨씬 더 대단하잖아!」

🐹 못치 「MoE는 마치 회사의 프로젝트 팀 같은 느낌이네. 전원이 매번 출근하는 게 아니라, 그 안건에 맞는 전문가들만 움직이는 거잖아!」

🦜 키나코 「R2가 늦어지는 원인은 Huawei Ascend의 CANN 미성숙과 인터커넥트 (Interconnect) 문제가 커.」

🦜 키나코 「게다가 NVIDIA H20의 수출 금지라는 더블 펀치로 인해, DeepSeek는 훈련 인프라 (Training Infrastructure)의 제약에 묶여 있는 상태야.」

🐹 못치 「기술력의 문제가 아니라 지정학적인 환경 때문에 R2가 늦어지고 있는 거구나. DeepSeek는 진심으로 해내려고 하지만 외부 요인에 발목이 잡혀 있는 느낌이야.」

🦜 키나코 「만약 Huawei Ascend가 성숙해져서 NVIDIA가 필요 없게 된다면, DeepSeek는 정말로 게임 체인저 (Game Changer)가 될 수 있을지도 몰라.」

🦜 키나코 「V4-Flash는 지금 바로 API로 테스트해 볼 수 있어. 입력 100만 토큰 (Token)에 0.14달러니까, 1달러만 있어도 상당한 양을 테스트할 수 있지. 개인 개발자에게는 혁명적인 가격 설정이야.」

🐹 못치 「1달러에 700만 토큰이라니! 그런 양을 일반적인 개인 개발자가 다 쓸 수 있을까? 오히려 신경 쓰지 않고 마음껏 쓸 수 있는 시대가 왔네. 그건 확실히 혁명적이다.」

🦜 키나코 「그래서 질문인데, 여러분은 DeepSeek의 R2 소문을 믿었나요? 실제로 DeepSeek의 API를 사용해 본 적이 있나요? 댓글로 알려주세요.」

🦜 키나코 「개인 개발자의 관점에서 볼 때, V4-Flash의 API 비용 절감이 실제로 어느 정도 임팩트가 있었는지 구체적인 숫자와 경험을 들려주시면 감사하겠습니다.」

🐹 못치 「R2를 기다리는 동안 V4를 쓸 수 있으니까, 나도 바로 써볼게! 다음 영상에서 어떤 결과였는지 보고할게!」

🦜 키나코 「다음 영상에서도 계속해서 AI의 최신 트렌드를 깊이 있게 파헤쳐 볼게요. 기대해 주세요!」

키나코 못치의 테크 심층 분석에서는 AI/LLM을 중심으로 한 테크 전반을 햄스터 (🐹 못치)와 사랑앵무 (🦜 키나코)의 대화로 즐겁게 해설하고 있습니다.

▶️ 영상으로 보기 → DeepSeek R2의 정체는 SEO 블로그! 소문의 환상·Huawei 실패·V4의 실력을 철저 해설

👍 이 글이 도움이 되었다면 LGTM·북마크 해주시면 큰 힘이 됩니다!

📺 채널 구독은 여기로 → 키나코 못치의 테크 심층 분석

🔗 다른 해설 영상도 보기 → 키나코 못치의 테크 심층 분석 영상 목록

DeepSeek R2의 정체는 SEO 블로그! 소문의 실체·Huawei 실패·V4의 실력을 철저 해설

요약

핵심 포인트

댓글