게임 이론으로 읽는 중국의 AI 전략 ― '최첨단 모델은 병기로서 국가 관리되는가'

2026년 4월, Anthropic이 일반 비공개인 「Claude Mythos Preview」를 발표했습니다. 일반 공개를 보류하고 한정된 파트너(Project Glasswing)에게만 제공한다는 이례적인 판단은, 어떤 하나의 기술적인 관점을 부각시킨 것으로 보입니다.

사이버 공격 능력(취약점 발견·exploit 생성)은 의도적으로 훈련한 것이라기보다, 코딩 능력을 높인 결과로서 「창발적으로(emergently)」 발현된 부산물이 아닌가.

이 전제를 바탕으로, AI 연구자인 이마이 쇼타(Shota Imai) 씨(@ImAI_Eruel)가 흥미로운 견해를 제시하고 있습니다. 요약하자면 "스케일링(Scaling)과 코딩 능력의 레이스를 계속하면, 어느 연구소든 자연스럽게 Mythos급에 도달한다. 미국 측은 안전성을 위해 공개를 제한하겠지만, 중국은 비교적 용이하게 공개할 수 있으므로, 반년~1년 내에 무제약으로 Mythos급을 오픈할 것이다"라는 내용입니다.

본 기사에서는 이 견해에 대해 역방향의 가능성도 고려할 수 있지 않을까 하는 제기를 해보고자 합니다. 즉, 중국은 오히려 최첨단 모델을 「병기」로 간주하여 국가 관리로 향할 가능성도 있지 않을까 하는 가설입니다. 그리고 이를 단순한 직관으로 끝내지 않고, 게임 이론(Game Theory)의 틀로 조금 구조화하여 살펴보겠습니다.

먼저 대략적인 견해를 말씀드려 놓겠습니다. 중국의 행동은 일률적이지 않으며, 능력의 종류에 따라 참여하고 있는 게임이 다르고, 각각 별도로 최적화되어 있는 것이 아닌가 하는 정리입니다. 이 관점을 취하면, 「개방」과 「봉쇄」가 반드시 모순되지 않고 양립할 수 있는 구조가 보이는 것 같습니다.

주의: 본 기사는 보안·지정학을 다루지만, 선동이나 특정 국가를 비난하는 것을 목적으로 하지 않습니다. 어디까지나 공개 정보와 보도를 게임 이론이라는 렌즈로 정리해 보는 사고 실험입니다. Mythos 관련 능력치는 Anthropic의 자기 공개에 의존하고 있으며, 독립적인 검증은 부분적인 수준에 머물러 있다는 점도 미리 말씀드립니다.

게임 분석에 들어가기 전에, 토대가 되는 사실을 확인해 두겠습니다.

Anthropic의 설명에 따르면, Mythos의 사이버 보안 능력은 공격 용도를 겨냥한 집중 훈련의 산물이 아니라, "코드·추론·자율성의 전반적인 향상의 하류 결과(downstream consequence)로서 창발한" 것이라고 합니다. 능력의 일부는 영국 AI Security Institute에 의해 독립적으로 확인되었으며, 미지의 중대한 취약성을 자율적으로 발견·exploit화한 사례도 보고되었습니다. 다만, 이는 어디까지나 Anthropic 측의 공개와 일부 외부 검증에 기반한 것이며, 전모가 독립적으로 확인된 것은 아니라는 점에는 유의가 필요합니다.

여기서 본 기사가 주목하고 싶은 것은, 이마이 씨와 공유하고 있는 핵심적인 전제입니다.

생성형 AI의 주요 수익원은 현재 코딩이다
공격 능력은 코딩 능력과는 독립된 변수라기보다, 그 종속 변수에 가깝지 않은가
그렇다면 "코딩은 키우고 싶지만 공격 능력은 억제하고 싶다"는 것은, 솔직히 생각하면 양립하기 어렵다

이 전제 자체는 대체로 타당하다고 생각합니다. 의견이 갈릴 수 있는 부분은, 오히려 이 능력에 도달한 중국이 어떻게 움직일 것인가 하는 한 점이라고 생각합니다.

빠지기 쉬운 단순화로서, 중국을 「개방을 좋아하는 국가」 혹은 「통제를 좋아하는 국가」라고 단일한 모습으로 파악해 버리는 경우가 있는 것 같습니다. 실제로는 중국의 AI를 둘러싼 행동에는 적어도 4가지의 서로 다른 게임이 중첩되어 있으며, 능력의 종류에 따라 어떤 게임이 지배적이 될지가 달라지는 것이 아닐까 생각됩니다.

이하, 순서대로 분해해 보겠습니다.

플레이어: 중국 연구소(DeepSeek, Qwen 등) vs 미국 폐쇄형 연구소(Anthropic, OpenAI 등)

범용·상용 모델 계층에서 중국은 「무료·오픈 웨이트(open weight)로 동등한 제품을 뿌리는」 전략을 취하고 있는 것으로 보입니다. 이는 죄수의 딜레마(Prisoner's Dilemma)라기보다, 커밋먼트 게임(Commitment Game)으로 읽는 것이 실태에 더 가까울지도 모릅니다.

| 미국: 폐쇄형 API로 높은 마진 |
|---|---|
| 중국: 오픈 웨이트 무료 배포 | 미국의 가격 결정력이 무너지기 쉬워짐 |

중국이 "우리는 항상 최첨단의 몇 달 뒤처진 모델을 무료로 내놓는다"라고 신뢰할 수 있는 형태로 커밋(Commit)하면, 상대의 수익 모델 자체를 흔들 수 있습니다. DeepSeek R1이 보여준 것은 바로 이 「초토화 전략」이 일정 정도 기능할 수 있다는 사례였다고 할 수 있습니다.

이 게임에서 중국의 합리적인 수는 「개방 지속」이 되기 쉽다고 생각합니다. 그만둘 동기가 부족하며, 오히려 상대가 고통받을수록 계속할 유인이 작동하는 구조입니다.

정책적 뒷받침도 어느 정도 갖춰져 있습니다. 「AI+」 이니셔티브(2025년 7월, 국무원 승인)는 오픈 소스 에코시스템 (Open Source Ecosystem) 구축을 명시하고 있으며, 리창(Li Qiang) 총리는 WAIC 2025에서 오픈 소스 공유 확대에 대해 언급했습니다. 제15차 5개년 계획 또한 「중국 오픈 소스의 세계적 전개 가속화」를 내걸고 있습니다.

이 계층에 한해서라면, 이마이(Imai) 씨의 견해(중국은 공개할 것이다)는 타당하다고 생각됩니다.

하지만 공격 능력의 계층에서는, 동일한 플레이어가 거의 정반대의 인센티브 (Incentive)에 직면하는 것처럼 보입니다.

취약점 (Exploit)에는 간과할 수 없는 성질이 있습니다. 공개하는 순간 공격 자산으로서의 가치가 크게 떨어진다는 점입니다. 협력적 공개 (Coordinated Disclosure)를 하면 패치 (Patch)가 적용되어, 공격 자산으로서는 사실상 사장되어 버립니다.

	취약점 공개	취약점 은닉
공격 가치	낮음 (패치됨)	높음 (공격에 사용 가능)
방어 가치	높음 (모두가 방어 가능)	낮음 (자국도 표적이 될 수 있음)

공격 능력을 중시하는 국가 플레이어에게는, 취약점은 은닉하는 편이 더 합리적이 되기 쉽다고 할 수 있습니다.

그리고 중국은 이와 유사한 것을 이미 제도로 구현하고 있는 것으로 보입니다. 「네트워크 제품 보안 취약점 관리 규정 (RMSV, 2021년 시행)」은 취약점을 48시간 이내에 당국에 보고하도록 하며, 패치 전의 공개, PoC (Proof of Concept) 공개, 국외 공개를 제한하고 있습니다. 취약점 발견 콘테스트인 천푸컵 (Tianfu Cup) 또한 최근에는 공안부 주관이 되어 은닉성이 높아졌다고 보도되고 있습니다.

이것들이 시사하는 바는, 「공공재가 되어가던 취약점을 사적 재화 (국가의 관리하)로 되돌리는」 방향의 운용이 아닌가 하는 점입니다.

이 부분이 본 기사 견해의 핵심입니다. 동일한 국가가 모델은 공공재로서 개방하고, 공격 성과물은 사적 재화로서 가두어 둡니다. 이는 모순이라기보다, 서로 다른 게임을 별도로 최적화하고 있는 결과라고 읽을 수 있습니다.

여기서 어려워지는 점은, Mythos급 모델이 게임 1의 재화 (범용 모델)이면서 동시에 게임 2의 재화 (공격 자산)이기도 한 양의적 존재가 될 수 있다는 점입니다.

이때 중국은 분리 (Separating)적인 대응을 선택할 것이라고 예상할 수 있습니다. 시그널링 게임 (Signaling Game)의 분리 균형 (Separating Equilibrium)에 가까운 구조입니다. 하나의 모델 계열을 능력의 임계치 (Threshold)로 나누는 이미지입니다.

능력이 임계치 이하 → 오픈 소스로 출시 (게임 1을 지속하며 에코시스템 영향력을 확보하러 감)
능력이 임계치 초과 (자율적 사이버 공격이 가능한 수준) → API 한정 / 가중치 (Weights) 비공개, 국가 관리로 전환 (게임 2로 이행)

이 관점에 서면, 「Mythos급에 도달하면 병기로 간주하여 국가 관리한다」는 예측은 게임 이론적으로도 비교적 정합성이 높은 시나리오로 위치할 수 있습니다.

중국의 입장에서 보면, 최강 모델을 개방하는 것은 「자신의 가장 좋은 패를 상대에게 무료로 배포하는 것」에 가깝습니다. 게임 2의 논리에 무게를 둔다면, 이는 선택하기 어려운 수가 될 것이라고 생각됩니다. 다만, 후술하듯이 이 예측에는 몇 가지 전제가 작용하고 있다는 점에는 주의가 필요합니다.

인재 확보(囲い込み)는 위의 게임보다 시간적으로 선행하는 수로서 설명할 수 있다고 생각합니다.

모델이나 취약점 (Exploit)은 복제가 가능하지만, 그것을 만드는 인간은 용이하게 복제할 수 없는 희소 자원입니다. 게임 이론적으로 보면, 중국은 우선 가장 희소하고 대체가 어려운 자원 (톱 연구자)을 먼저 고정하려 했다고 읽을 수도 있습니다.

구체적인 움직임으로서, 보도에 기반하면 다음과 같은 것들을 들 수 있습니다.

출국 제한: 2025년 3월경부터 DeepSeek가 일부 핵심 R&D 직군에 여권 제출을 요구하며 해외 출입국을 실질적으로 제한하고 있다고 보도되었습니다. 명목은 당초의 「상업 기밀」에서 「국가 기밀」로 바뀌었다고 합니다.
인재 불러들이기: 천인계획 (Thousand Talents Plan)의 후속이라 여겨지는 「Qiming (启明) 계획」이 MIIT (공업정보화부) 주관으로 운용되며, 주거 보조금 외에 300~500만 위안 규모의 사이닝 보너스 (Signing Bonus)로 해외 톱 인재를 노리고 있다고 보도되었습니다. 2025년 10월에는 젊은 STEM 인력을 위한 「K자 비자」도 신설되었습니다.

특히 흥미로운 점은 명목의 변화입니다. 「상업 기밀」에서 「국가 기밀」로 용어가 바뀐 점은, 당국이 「이것은 게임 1 (상업 경쟁)이 아니라, 게임 2/3 (국가 안보)에 속하는 문제다」라고 내부적으로 재정의했다는 시그널로 읽힐 수 있습니다 (어디까지나 하나의 해석입니다).

역방향 귀납법 (Backward Induction) 관점에서 바라본다면 어느 정도 일관성이 있습니다. 만약 미래에 Mythos급 모델을 국가가 관리하는 균형 (Equilibrium) 상태를 내다보고 있다면, 그 전제로 인재가 국외에서 동일한 능력을 재생산하는 경로를 미리 차단해 두는 것이 합리적인 선행 수 (先行的手)가 될 수 있기 때문입니다. 출국 제한과 Qiming 계획은 종반의 '국가 관리' 균형으로부터 역산된 포석이라는 해석도 성립할 수 있다고 생각합니다.

4가지 게임을 통합하면, 대략 다음과 같은 계층별 전망이 떠오릅니다.

계층	지배적이기 쉬운 게임	예상되는 중국의 경향
범용·상용 모델	게임 1 (초토화 전략)	개방 지속. 오히려 가속화될 수 있음
...

이마이 씨의 '개방한다'는 전망은 틀렸다기보다, 임계값 (Threshold) 미만의 계층에 관한 이야기로 받아들이는 것이 자연스럽지 않을까 합니다. 그 위에서, 최강 모델 계층에서는 역방향의 균형으로 향할 수 있다는 것이 본 기사의 통합적인 전망입니다.

게임 이론에 의한 예측에는 전제가 있으며, 그 전제가 무너지면 결론도 바뀝니다. 기술자로서 모델의 가정은 가능한 한 명시해 두고 싶습니다.

「임계값」이 관측 가능하다고 가정하는 점

현실에서는 특정 모델이 '자율 사이버 공격급'인지 여부를 사전에 판정하는 것이 쉽지 않습니다. 임계값이 모호하다면 중국이 판단을 잘못하여 개방해 버리는 것(이마이 씨의 시나리오)도 있을 수 있고, 반대로 과도하게 가두어 버릴 가능성도 있습니다.

중국을 단일한 합리적 행위자 (Rational Actor)로 간주하는 점

실제로는 CAC, MIIT, 공안부, 민간 연구소, 지방 정부의 이해관계가 반드시 일치하지 않으며, 대리인 문제 (Principal-Agent Problem)를 내포하고 있습니다. 상업적 성공을 추구하는 연구소(게임 1에서 이기고 싶어 함)와 안보를 우선시하는 당국(게임 2를 강제하고 싶어 함)이 줄다리기를 하는 구도입니다. DeepSeek V4가 오픈 상태를 유지한 사실은, 현시점에서는 아직 연구소 측의 논리가 우세한 국면임을 시사한다고도 읽을 수 있습니다.

미국의 수를 상수로 취급하는 점

실제로는 동시 수단 게임 (Simultaneous Game)입니다. 미국이 Mythos급 모델을 한정된 파트너에게만 공개한 것(Project Glasswing) 자체가 중국에게 "상대도 가두었다. 그렇다면 우리도"라는 모방적 반응 (Tit-for-tat)을 유발할 가능성이 있습니다. 반대로 미국이 갑자기 오픈화로 전환한다면 중국의 계산도 달라질 것입니다.

반복 게임 (Repeated Game)이라는 점의 함의

이것은 단판 승부가 아니라 반복 게임이므로 평판 (Reputation)이 작용합니다. 중국이 '항상 개방하는 국가'라는 평판을 쌓는 것 자체가 전략적 가치가 있기 때문에, 게임 2의 논리가 있더라도 아슬아슬한 순간까지 개방을 지속하다가 임계값을 넘는 순간에만 비공개로 전환하는 '트리거 전략 (Trigger Strategy)'을 채택할 가능성도 충분히 고려할 수 있습니다. 이는 본 기사의 'Mythos급에 도달했을 때'라는 조건부 전망과도 상당히 일치합니다.

예측을 검증 가능하게 하기 위해, 관측해 두어야 할 지표를 나열해 둡니다. 이것들이 나타난다면 '무기화·국가 관리' 시나리오가 우세해졌다는 신호로 읽을 수 있을지도 모릅니다.

【최중요】 DeepSeek 또는 Qwen이 다음 플래그십 모델을 갑자기 클로즈드(API 한정·가중치 비공개)로 전환함 ← 중국이 게임 1에서 게임 2/3로 내부적으로 재정의했다는 비교적 강력한 징후

CAC가 프론티어 모델 (Frontier Model)의 공개를 처음으로 저지하는 사례
수출 관리법의 캐치올 (Catch-all) 조항이 AI 모델 가중치/알고리즘에 처음 적용되는 사례
Qiming 계획이 반도체·AI 인재를 실제로 불러들인 규모의 확대

반대로 DeepSeek나 Qwen이 앞으로도 최강급 모델을 오픈으로 계속 내놓는다면, 적어도 범용 계층에서는 이마이 씨 측의 균형이 지속되고 있다는 뜻이 됩니다. 실제로 DeepSeek V4(2026년 공개)는 오픈 소스를 유지하고 있으며, 현시점의 관찰 사실로서는 '범용 계층은 개방 지속'이라고 말할 수 있을 것 같습니다.

중국의 AI 전략은 단일한 형태가 아니라, 능력의 종류에 따라 지배적인 게임이 달라지는 것이 아닌가

범용 모델 계층에서는 '초토화 전략'으로서 개방이 합리적이기 쉬움 (이마이 씨의 전망이 들어맞는 계층)
공격 결과물 계층에서는 '사적 재화화'로서 은닉이 합리적이기 쉬움 (이미 유사한 제도가 존재함)
Mythos급은 양의적(Ambivalent)이므로, 능력 임계값에서의 '분리 균형 (Separating Equilibrium)' = '무기화·국가 관리'로 향할 가능성이 비교적 높다고 생각됨
인재의 가두기는 그 종반의 균형으로부터 역산된 선행 수로 설명 가능할 듯함

「중국은 쉽게 공개한다」와 「중국은 병기로서 가두어 관리한다」는 반드시 이분법적인 선택의 문제는 아니라고 생각합니다. 오히려 두 가지 모두 서로 다른 층위에서 동시에 성립할 수 있습니다. 이것이 게임 이론 (Game Theory)이라는 렌즈로 바라보았을 때, 현시점에서의 하나의 견해입니다.

마지막으로 기술자로서 한 말씀만 덧붙이겠습니다. 만약 이 견해가 어느 정도 맞다면, 우리가 대비해야 할 것은 「Mythos급 모델이 제약 없이 유통되는 세계」와 「최강 모델이 국가의 관리하에 가두어지는 세계」 양쪽 모두일지도 모릅니다. 전자에 대해서는 패치 적용의 가속화나 기본적 견고함 (Default Robustness) 강화로, 후자에 대해서는 공급망 (Supply Chain) 및 의존 관계의 재검토로 대비하는 방식입니다. 어느 쪽으로 기울더라도, 공격과 방어의 비대칭성이 줄어드는 방향으로 움직일 가능성은 높다고 생각합니다.

본 기사는 아래의 1차 자료, 보도 및 분석을 바탕으로 작성되었습니다. Mythos 관련 능력치는 Anthropic의 자기 공개에 의존하고 있으며, 독립적인 검증은 부분적인 수준에 머물러 있다는 점에 유의하시기 바랍니다. 또한 인재 관련 정보의 상당수는 Bloomberg, Reuters, WSJ 등의 보도를 기반으로 하며, 중국 정부의 공식 발표를 통해 전체 모습을 확인할 수 있는 것은 아닙니다.

Mythos / Anthropic 관련

Anthropic, "Claude Mythos Preview" 발표 (2026년 4월) 및 Project Glasswing 관련 발표
Anthropic, "Responsible Scaling Policy" (RSP, ASL-3의 가중치 보호 요건)
Anthropic, AI 주도 사이버 첩보 캠페인 (GTG-1002)에 관한 위협 보고서 (2025년 11월)
Cloud Security Alliance, "Claude Mythos and the AI Autonomous Offensive Threshold"

중국의 오픈 소스 (Open Source) 전략

중국 국무원 「AI+」 이니셔티브 (2025년 7월)
리창 총리 WAIC 2025 연설, 세계 AI 협력 기구 (WAICO) 구상
arXiv: 2512.03073 "Economies of Open Intelligence" (중국의 모델 점유율이 미국을 상회했다는 분석, Stanford HAI 인용)
The Diplomat, "The Global Implications of China's 5-Year Plan AI Ambitions"

취약성의 국가 관리

중국 「네트워크 제품 안전 취약점 관리 규정 (RMSV)」 (2021년 시행)
Natto Thoughts / SecurityWeek, 천부컵 (Tianfu Cup) 공안부 주관화 및 Qihoo 360의 멀티 에이전트 (Multi-agent) 취약점 발견 시스템에 관한 분석

인재 가두기

Reuters, "China quietly recruits overseas chip talent as US tightens curbs" (Qiming 계획, 사이닝 보너스 규모)
Bloomberg / WSJ, DeepSeek 등의 출국 제한 및 여권 제출에 관한 보도 (2025년 3월 이후)
K자 비자 신설 (2025년 10월)에 관한 보도

미중 능력 차이 · 매크로 동향

Stanford HAI, "2026 AI Index Report" (2026년 4월) ― 미중 톱 모델의 Elo 차이, 미국으로의 AI 연구자 유입 감소
NIST CAISI, "Evaluation of DeepSeek AI Models" (2025년 9월, 가드레일 (Guardrail) 취약점 평가)
CSET (Georgetown), 중국의 이중 용도 품목 수출 관리 조례 (2024년 12월 시행) 및 군사 AI에 관한 각 분석
미국 하원·중국 특별위원회에 의한 중국제 AI 모델의 안보 리스크 조사

수출 관리 · 규제 프레임워크

중국 수출 관리법 (2020) / 이중 용도 품목 수출 관리 조례 (2024년 12월 1일 시행)
중국 생성형 AI 서비스 잠정 변법 (2023년 8월 15일 시행), 알고리즘 등록제

Insights

게임 이론으로 읽는 중국의 AI 전략 ― '최첨단 모델은 병기로서 국가 관리되는가'

요약

핵심 포인트

댓글

1,000명 감원 계획 발표 속에 급등한 소프트웨어 기업

BofA, 실적 발표를 앞두고 사이버 보안 유망주를 외면하다

Strategy, 우선주 배당금 마련을 위해 1억 500만 달러 규모의 bitcoin 매도

영어 학습자의 핵심 어휘는 70년 동안 어떻게 달라졌나

BofA, 실적 발표를 앞두고 사이버 보안 유망주를 외면하다

Strategy, 우선주 배당금 마련을 위해 1억 500만 달러 규모의 bitcoin 매도

영어 학습자의 핵심 어휘는 70년 동안 어떻게 달라졌나