Anthropic 대 Alibaba: 역대 최대 규모의 AI 모델 증류 (Distillation) 공격 — 2,880만 건의 Claude 대화
요약
Alibaba가 25,000개의 가짜 계정을 동원해 Anthropic의 Claude 모델로부터 2,880만 건의 대화를 추출하는 대규모 모델 증류 공격을 수행했다는 의혹이 제기되었습니다. 이번 사건은 단순한 기술 탈취를 넘어 미-중 간의 AI 인프라 군비 경쟁과 지정학적 갈등을 심화시키는 양상을 보입니다.
핵심 포인트
- Alibaba가 Claude의 에이전트 추론 능력을 목표로 산업 규모의 증류 공격 수행
- 모델 증류는 교사 모델의 출력을 이용해 저비용으로 성능을 복제하는 방식
- 이번 공격은 역대 최대 규모로, 미-중 AI 기술 패권 경쟁의 단면을 보여줌
- AI 모델 탈취가 R&D 비용을 회피하는 불법적 수단으로 악용됨
요약: Anthropic은 Alibaba가 역대 탐지된 것 중 가장 큰 규모의 AI 모델 증류 (Distillation) 공격을 수행했다고 공식적으로 비난했습니다. 이들은 약 25,000개의 가짜 계정을 사용하여 44일 동안 Claude와 2,880만 건의 대화를 생성했습니다. 이 비난은 펜타곤(Pentagon) 블랙리스트, 수출 통제 역설, 미국의 새로운 입법, 그리고 중국이 공개한 대응 무기인 “Yitian Tulong”을 포함하는 지정학적 폭풍을 일으켰습니다.
Alibaba의 역대 최대 AI 증류 (Distillation) 공격에 대한 Anthropic의 비난에 관한 CNBC-TV18 AI Pulse 보고서
실제로 무슨 일이 일어났는가?
2026년 4월 22일부터 6월 5일 사이, Alibaba 및 그 Qwen AI 연구소와 연계된 운영자들이 Anthropic의 Claude 모델을 대상으로 산업 규모의 AI 모델 증류 (Distillation) 공격을 실행했습니다. 6월 10일 Tim Scott 상원의원과 Elizabeth Warren 상원의원에게 보낸 공식 서한에 따르면, 공격자들은 약 25,000개의 사기 계정을 사용하여 2,880만 건의 대화를 생성했습니다. 이들은 특히 Mythos Preview 클래스를 중심으로 Claude의 가장 진보된 소프트웨어 엔지니어링 및 에이전트 추론 (Agentic Reasoning) 능력을 목표로 삼았습니다.
"이러한 증류 (Distillation) 공격은 프런티어 연구소(Frontier Labs) 전반에 걸친 미국의 AI 역량을 수확하여, 훈련 및 R&D 비용을 부담하지 않고 자신들의 것으로 재포장하기 위해 불법적이고 체계적이며 산업적 규모로 수행됩니다,"라고 서한은 명시하고 있습니다.
AI 증류 (Distillation) 공격이란 무엇인가?
AI 모델 증류 (Distillation)는 더 큰 "교사 (Teacher)" 모델의 출력을 사용하여 더 작은 "학생 (Student)" 모델을 훈련시키는 방식입니다. 학생 모델은 훈련 비용의 극히 일부만 사용하여 교사 모델의 능력을 모방하는 법을 배웁니다. 합법적인 맥락에서 이는 가치 있는 연구 도구입니다. 하지만 산업적 규모로 승인 없이 수행될 경우, 이는 **AI 절도 (AI Theft)**가 됩니다. 공격자는 핵심 능력을 복제하면서도 수십억 달러에 달하는 R&D 비용을 회피하게 됩니다.
AI 모델 증류 (Distillation)와 이것이 어떻게 비용의 극히 일부로 AI 능력을 복제할 수 있게 하는지에 대한 설명 영상
이것은 처음이 아니었습니다 — 하지만 가장 컸습니다
Alibaba 캠페인은 2026년 초부터 탐지된 증류 (Distillation) 공격의 급격한 에스컬레이션(escalation) 중 가장 최근의 사례입니다. 각 연속적인 캠페인은 규모 면에서 엄청난 도약을 보여줍니다:
| 엔티티 (Entity) | 교환 건수 (Exchanges) |
|---|---|
| DeepSeek | 150,000건 이상 |
| ... |
AI 하네스 엔지니어링 (AI harness engineering)이 소프트웨어 개발을 가속화함에 따라, 합법적 및 악의적 증류를 위한 도구들은 더욱 강력해지고 있으며 — 탐지하기는 더 어려워지고 있습니다. 이러한 에스컬레이션은 양측 모두가 프런티어 역량 (frontier capabilities)에 자원을 쏟아붓고 있는 더 넓은 범위의 미-중 AI 인프라 군비 경쟁 (US-China AI infrastructure arms race)을 반영합니다.
아이러니한 규제적 배경
Anthropic의 서한이 전달된 지 단 이틀 후인 6월 12일, 미국 상무부는 Anthropic에 자사의 외국인 직원들을 포함한 모든 외국 국적자의 Fable 5 및 Mythos 5에 대한 접근을 중단하도록 명령했습니다. 미국의 AI 기업이 중국이 자사의 기술을 훔치고 있다고 비난하는 동시에, 미국 정부는 해당 기업이 동일한 기술을 판매하는 것을 막고 있습니다. Fortune은 이를 “국가 안보의 역설 (national security paradox)”이라고 불렀습니다.
여기에 또 다른 층위가 추가됩니다: 2026년 2월, Trump 대통령은 Anthropic이 “모든 합법적인 목적”을 위한 AI 사용을 허용하는 펜타곤(Pentagon) 계약 조건을 거부한 이후, 모든 연방 기관에 Anthropic 모델의 사용을 중단하도록 명령했습니다.
펜타곤, 블랙리스트, 그리고 Alibaba의 소송
Anthropic의 서한이 나오기 하루 전인 6월 9일, 펜타곤은 Section 1260H에 따라 Alibaba를 “중국 군사 기업” 목록에 추가했습니다. 그 후 6월 23일, Alibaba는 해당 지정이 “임의적이고 변덕스럽다 (arbitrary and capricious)”며 국방부를 상대로 소송을 제기했습니다. 역사상 최대 규모의 AI 절도를 주도했다는 혐의를 받는 기업이, 동시에 미국 법정에서는 자신이 중국의 군사 조직이 아닌 상업적 실체라고 주장하고 있습니다.
AI 증류를 겨냥한 새로운 입법
Bill Hagerty (R-TN) 상원의원과 Andy Kim (D-NJ) 상원의원은 미국의 AI 모델 출력값에 부적절하게 접근하다 적발된 중국 기업들을 블랙리스트에 올리거나 제재할 수 있는 국방 법안 수정안을 초안 작성 중입니다. 이 수정안은 증류 (Distillation)를 단순한 지식재산권 (IP) 절도가 아닌 **국가 안보 문제 (national security issue)**로 재정의합니다. 이는 프런티어 AI (frontier AI)가 몇 달 안에 정부를 불안정하게 만들 수 있다는 Five Eyes의 최근 경고를 바탕으로 합니다.
중국의 대응 — ‘Yitian Tulong’
6월 25일, 중국 보안 기업인 360 Security Technology는 베이징에서 열린 ISC.AI 2026 컨퍼런스에서 “Yitian Tulong” (천검과 용사검)을 공개했습니다. 이 모델의 Tulongfeng 구성 요소는 Alibaba가 복제하려고 시도했다고 의심받는 바로 그 모델인 “Mythos의 중국 버전”이라고 명시적으로 브랜드화되었습니다. NSA 국장 Joshua Rudd는 이전에 Mythos Preview가 “몇 주가 아니라 단 몇 시간 만에 우리의 거의 모든 기밀 시스템을 뚫었다.”라고 증언한 바 있습니다.
시장의 여파
**Alibaba 주식 (BABA)**은 6월 25일 4% 이상 하락하며 16개월 만의 최저치를 기록했습니다. Anthropic에 대한 의혹과 펜타곤의 블랙리스트 소송이라는 이중 충격은 미-중 기술 디커플링 (decoupling)에 대한 공포와 맞물려 수십억 달러의 시장 가치를 증발시켰습니다.
향후 전망
Hagerty-Kim 수정안(증류 공격에 대한 제재를 위한 법적 프레임워크를 구축할 수 있음), Alibaba의 소송(‘중국 군사 기업’ 지정에 대한 선례를 남길 수 있음), Yitian Tulong의 실제 역량, 그리고 다음 공격을 주목해야 합니다. 6개월도 채 되지 않아 15만 건에서 2,880만 건으로 급증한 공격 규모는 다음 캠페인이 1억 건의 교환을 돌파할 수도 있음을 시사합니다.
Sources
- Reuters — Anthropic, Alibaba가 Claude AI 모델의 능력을 불법적으로 추출했다고 밝히다
- CNBC — Anthropic, Alibaba가 AI 모델 능력을 '뻔뻔하게' 추출했다고 비난
- BBC — Anthropic, 중국 기업들이 대규모 AI 절도를 저질렀다고 비난
- Forbes — Anthropic, 미국의 수출 통제 명령 이후 Fable 5 및 Mythos 5 비활성화
자주 묻는 질문 (Frequently Asked Questions)
AI 증류 (AI distillation) 공격이란 무엇인가요?
AI 모델 증류 (AI model distillation)는 더 강력한 "교사 (teacher)" 모델의 출력값을 사용하여 더 약한 "학생 (student)" 모델을 학습시키는 방식입니다. 권한 없이 이를 수행하는 것은 AI 절도에 해당하며, 공격자는 수십억 달러에 달하는 연구 개발 (R&D) 비용을 회피할 수 있습니다.
Alibaba는 Claude에 얼마나 많은 쿼리를 보냈나요?
44일 동안 (~2026년 4월 22일 – 6월 5일) 약 25,000개의 가짜 계정을 통해 약 2,880만 건의 대화가 이루어졌습니다.
Yitian Tulong이란 무엇인가요?
360 Security Technology가 ISC.AI 2026에서 공개한 2부 구성의 AI 사이버 보안 시스템입니다. 이 중 Tulongfeng 구성 요소는 "Mythos의 중국 버전"이라는 브랜드로 명명되었습니다.
Mythos Preview란 무엇인가요?
Anthropic의 최첨단 사이버 보안 AI 모델입니다. NSA(미 국가안보국)는 테스트 과정에서 이 모델이 거의 모든 미국의 기밀 시스템을 "몇 주가 아니라 단 몇 시간 만에" 뚫었다고 증언했습니다.
대표 이미지: AI 생성 컨셉 아트. 비디오 출처: CNBC-TV18, CNBC. 기사는 원래 TekMag에 게시되었습니다.
_원문 게시처: TekMag
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기