Anthropic “Alibaba가 Claude AI 모델 역량을 불법 추출”

노래 가사를 물어보면 이 모델들이 갑자기 저작권 있는 자료를 기억해내는 게 웃기지 않나

그런데 그 책들로 학습한 모델을 폐기할 필요는 없었나

그 책들에서 얼마나 많은 “능력”을 “추출”했을까

“내가 정당하게 훔친 걸 네가 납치하려는 거잖아!”

증류에는 기본적으로 두 종류가 있음. 1) 질문을 던지고 답을 강화 신호로 쓰는 대규모의 멍청한 방식(블랙박스), 2) 한 모델이 다른 모델을 직접 알려주고 학습시키고 유도하는 더 표적화된 증류(RLAIF)
후자는 사실상 다른 모델의 방향 제시로 모델을 미세조정하는 것임. 수많은 기업이 매일 이렇게 미세조정을 하고 있음. 중국 연구소들도 거의 확실히 이 방식을 쓰고 있을 텐데, 단순한 질문에 대한 단순한 답을 긁어오는 것보다 최종 결과에 훨씬 효과가 좋기 때문임
이런 증류 불만은 문제를 실제보다 크게 부풀려 보이게 하려는 것이고, 목적은 보호주의적으로 미국 정부가 중국 모델 제공자를 막거나 금지하게 만드는 데 있어 보임. 이미 칩 수출통제 강화를 요구했는데, DeepSeek v4가 Huawei 칩에서 돌도록 설계됐고 다른 중국 업체들도 따라가고 있다는 점에서 웃김. 하지만 그걸 대놓고 말할 수는 없으니, 증류 모델이 자기들 모델만큼 안전하지 않을 수 있어서 수출통제를 더 요구한다고 주장함. 정작 자기 모델의 안전장치를 우회하는 탈옥을 보여주면, 어떤 모델이든 결국 탈옥될 수 있으니 안전은 걱정하지 말라고 할 것임

“증류 불만이 문제를 실제보다 부풀린다”는 부분은 맞지만, 안타깝게도 Reuters 기사 자체가 그 극화에 가담하고 있음. 첫 문단에서 증류가 “공격”이라는 Anthropic의 표현을 따옴표 없이 반복해, 독자가 이 프레임이 기업의 주장이라는 걸 알아차리기 어렵게 함. 증류는 공격이 아님

멍청한 질문일 수 있는데, 이 모델들은 페타바이트급 데이터로 학습된다고 알고 있었음. 더 큰 모델(Claude)에 질의해서 추출할 수 있는 질문/응답의 양은 꽤 제한적일 텐데, 학습 데이터셋에 비하면 물 한 방울 아닌가

https://research.nvidia.com/labs/lpr/slm-agents/ — 증류 데이터는 이런 모델을 쓰면 자연스럽게 생기는 부산물임. 효과적인 방어는 없음. Anthropic은 속도를 늦추고 모델 내부를 숨기려고 사고 블록을 요약으로 열화시키고 있지만, 결국 수학적으로는 답이 없고 다국적기업/대기업 규모에서는 충분히 잘 먹힘. 비용이 우선순위가 되는 순간 고객을 계속 붙잡아둘 잠금 효과가 사라짐

그들은 두 가지를 주장함. 1) Fable 5에 존재하는 특정 공개 탈옥은 위험하지 않으며, 여러 전문가가 확인했고 반대할 신뢰할 만한 증거가 없음. 즉 Anthropic이 아마 맞음
2) 모든 탈옥에 면역인 대규모 언어 모델을 만드는 것은 불가능함. 이 역시 반박할 신뢰할 만한 증거가 없으니 Anthropic이 전적으로 맞음
1번이 거짓이라면 탈옥 세부 내용을 공개하면 됨. supposedly Fable 5에서만 동작하니 가능한 위험도 없음
2번이 거짓이라면 다른 대규모 언어 모델 연구소가 이미 해냈어야 함. 여러 정부가 그런 프로젝트에 시장이 있다는 점을 분명히 했으니 더더욱 그럼

평가를 하고 있다면 모델을 학습하지 않을 뿐, 사실상 RLAIF를 하는 것과 같음. 결과만 보고 있는 셈임
근본적으로 인공지능 모델을 유용하게 유지하면서 이것을 막기는 매우 어렵다

1980년대 중후반 Steve Jobs가 Mac GUI를 베꼈다고 불평하던 일화가 떠오름. 정작 그는 Xerox Alto와 Star 운영체제에서 이뤄진 작업을 공개적으로 인정하지 않았음
“내가 이미 베낀 걸 네가 베끼려는 거잖아!”
인터넷 전체를 크롤링해서 거대한 대규모 언어 모델을 만들고는 복사당한다고 불평하는 꼴임

아마 Bill Gates에게 귀속되는 이 인용을 말하려던 것 같음: “글쎄, Steve, 이건 한 가지로만 볼 수 없는 것 같아. 우리 둘에게 Xerox라는 부자 이웃이 있었고, 내가 TV를 훔치려고 그 집에 들어갔더니 네가 이미 훔쳐 간 걸 알게 된 상황에 더 가깝지.”

Apple은 그 미팅이 열리기 전에 Xerox가 상장 전 주식 100만 달러어치를 살 권리를 줬음

그래, 인공지능 업계 전체가 서로 베끼는 사람들뿐임. 지난 40년 동안 기술적이거나 이타적인 사람들이 다른 인간을 돕기 위해 인터넷에 공유한 정보를 인공지능 회사들이 통째로 삼키면서 시작했고, 이어 해적판과 저작권 자료를 먹어치웠고, 이제는 인공지능 회사들끼리 서로 베끼고 있음
정보는 정말 자유로워지고 싶어 하지만, 인공지능 회사들은 문지기가 되고 싶어 함. 장기적으로는 더 지속 가능한 접근인 오픈 가중치가 이길 것이라고 봄

모든 대규모 언어 모델은 Jon Skeet를 신으로 여김

“내가 정당하게 훔친 걸 네가 납치하려는 거잖아!”

Anthropic이 “Claude AI 모델 능력을 불법적으로 추출했다”고 불평하고, 중국이 “미국 AI 연구소의 지식재산을 산업 규모로 훔친다”는 백악관 비난을 지지하는 위선이 정말 웃김
Anthropic, OpenAI, Google, Microsoft 등은 콘텐츠를 닥치는 대로 수집하면서 저작권자의 권리를 무시해 모델을 학습했음. 이제 그중 하나가 자기들이 모두 했던 일을 다른 주체가 했다고 부당하다고 외치는 건가

인공지능 회사들은 인터넷에 있는 모든 것은 공짜지만 자기 것만 예외라고 보는 듯함. AI 크롤러로 무작위 웹사이트를 두들겨대고, robots.txt를 무시하고, 대역폭 비용을 폭증시키는 건 괜찮음. 하지만 데이터 수집 관행 때문에 AI 제공자에게 비용을 발생시키면 그건 명백히 용납할 수 없다는 식임

현행법상 Claude 출력은 공유 영역이라 정확히 같은 경우는 아님. 그래서 중국 쪽은 여기서 아무것도 훔친 게 없음

네 것은 내 것이고, 내 것은 여전히 내 것임

도둑들 사이에 의리는 없음

지금 벌어지는 일은 이렇다: 중국 리셀러들이 공식 Anthropic API 가격보다 70~90% 낮은 가격에 Claude 토큰을 제공하고 있음. 이들은 Claude Max 계정을 풀링해 용량을 재판매하고, 결제 사기를 쓰며, 모델 출력과 추론 체인을 여러 중국 연구소에 되팔아 달성함. 사용자 로그와 추론 흔적을 받는 대가로 모델 접근을 보조하고, 그걸 학습 데이터로 팔아서 원가 이하로 운영할 수 있음
Claude와 ChatGPT는 둘 다 중국에서 차단돼 있음. 접근하려면 VPN이 필요하고, 중국 은행 카드로 결제할 수 없음. 그래서 Claude 접근을 원하는 대부분은 리셀러를 통해 접근권을 삼. 중국에서 Anthropic 모델에 접근하는 가장 쉽고 싼 방법임
이 리셀러들은 수만 개의 봇 계정을 운영하며, Anthropic이 봇 공세를 늦추려고 신원 인증을 도입한 이유도 여기에 있음
한 토큰 리셀러는 Opus 4.8을 공식 API 요금보다 93% 할인해서 제공함: https://yunwu.ai/pricing?provider=Anthropic
이것이 DeepSeek와 GLM 가격이 그렇게 싼 이유 중 하나임. 중국에서 말도 안 되게 낮은 토큰 가격과 경쟁해야 하므로, 사람들이 쓰게 하려면 가격을 낮게 유지해야 함
몇 달 전에 이 얘기를 공유했지만 별 반응을 얻지 못했음. 중국의 토큰 재판매 경제를 설명하는 훌륭한 글임: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...

경쟁에는 좋은 일임. 중국 판매자가 더 싼 해법을 제공하는 것, 내가 경제학에서 배운 자유시장이 바로 그런 거였음
Anthropic이 경쟁하고 싶다면 자기 일을 더 잘해야 한다고도 배웠음. 아니면 누군가가 이길 것임
이제 거대 미국 기업에는 이 원칙이 적용되지 않나

DeepSeek와 GLM이 중국에서 말도 안 되게 낮은 토큰 가격과 경쟁하느라 싸다는 설명은 전혀 납득이 안 됨 DeepSeek와 GLM은 오픈 가중치이고, 미국 추론 제공자들도 훨씬 싼 가격에 팔고 있음. 가격이 싼 이유는 모델이 더 효율적이기 때문임

그들이 Claude Max 5x 계정을 풀링해 용량을 재판매하고, 결제 사기를 쓰며, 모델 출력을 여러 중국 연구소에 판다는 얘기라면, 자기 계정을 직접 얻는 것보다 싼가
그렇지 않다면 “Anthropic/OpenAI가 1,000달러어치 토큰을 100달러에 팔아서 엄청난 돈을 잃고 있다”는 AI 약세론자들이 흔히 꺼내는 얘기처럼 들림

Anthropic은 Mythos를 여기에 투입해 리셀러 문제를 정면으로 해결할 수 있을 것 같음. 리셀러를 통해 여러 계정을 구매하고, UID가 들어간 메시지를 보내고, Anthropic 로그에서 이를 포착한 뒤, 계정을 폐쇄하고 메타데이터로 연관 계정을 식별하는 루프를 돌리면 됨

그 리셀러들은 사실 Kimi K2.5나 GLM5.1을 Opus로 속여 파는 것뿐임. 중국인들은 오랫동안 여러 산업에서 위조 게임을 해오는 법을 잘 알고 있음

Alibaba의 행위가 “증류” 노력으로 설명되는데, Anthropic은 이를 더 강한 모델의 출력으로 덜 강한 모델을 학습시키는 것이라고 말했음
Claude는 허가 없이 테라바이트급 콘텐츠를 써서 자기 모델을 학습했고 그건 괜찮다고 했음. 이제 누군가 Claude 모델의 출력을 써서 모델을 학습하자 부당하다고 외치는 중임

괜찮지 않았음. 10억 달러를 내야 했음

Anthropic이 학습 데이터 출처를 공개하고, 왜 자기는 되뇌어진 학습 데이터를 고객에게 유료로 제공할 권리가 있지만 Anthropic 모델로 자기 모델을 학습한 Alibaba는 안 되는지 설명해야 하는 재판이 기대됨
재미있을 듯

그 정서에는 공감하지만, 당사자들의 국제적 위치와 복잡한 관계를 보면 실제로 재판까지 갈 가능성은 낮아 보임
Anthropic의 행동은 수행적 제스처처럼 보임. 다른 이들도 이미 그 대상 청중이 누구일지 추측했음

정확히 무엇이 불법이라는 건가
법적으로 모델 출력은 국내법이든 국제법이든 지식재산권으로 보호될 수 없음. 기대할 수 있는 최대치는 민사상 구제인데, 자기들이 모델을 학습하는 데 쓴 방식이 말 그대로 불법적이었다는 점을 고려하면 그것도 무리임
Anthropic은 자신이 모두에게 해온 방식 그대로 대우받았음. 자기들이 만든 침대이니 이제 자기들도 거기서 자야 함

Anthropic은 Newspeak의 달인임. 예전에도 Mythos 관련해서 버그를 취약점이라고 바꿔 불렀음. 증류는 서비스 약관 위반일 뿐이고, 이는 형사 범죄가 아니라 민사상 문제임. 불법도 아니고, 법을 어긴 것도 아님

Alibaba의 행위가 더 강한 모델의 출력으로 덜 강한 모델을 학습시키는 “증류”라고 하는데, 이게 뭐가 잘못인지 모르겠음
Anthropic은 이 캠페인이 2026년 4월 22일부터 6월 5일까지 진행됐고, 거의 25,000개의 사기 계정을 통해 Claude와 2,880만 건 넘는 교환을 생성했다고 했음
무엇이 그 계정을 사기로 만드는가. 합의된 가격을 냈다면 괜찮은 것 아닌가. 돈을 내지 않았다면 왜 Anthropic은 서비스를 제공했나

무엇이 사기 계정으로 만드냐고? 가짜 신원일 수 있고, 사용 목적에 대한 전반적 기만일 수 있음

Anthropic의 서비스 약관에는 “돈만 내면 어떤 목적으로든 서비스를 쓸 수 있다”보다 훨씬 많은 조건이 있기 때문임

추론 흔적을 읽고 스스로 배울 수도 있겠지? /s

증류는 근본적으로 막을 수 없음. 할 수 있는 건 늦추는 것뿐임. 반박해보라
결국 중국 회사들은 Honey 같은 확장 프로그램을 내놓을 것이고, 실제 비중국 고객 위에 올라타서 모든 것을 어차피 중국으로 보낼 것임
끝났음

코드 작성이나 취약점 찾기 같은 일부 능력의 증류를 막기엔 이미 너무 늦었음 [1]
하지만 AI 연구소는 모델을 공개해 잠재적 증류에 노출하지 않고도 막대한 경제적 가치를 계속 만들 수 있음. 예를 들어 모델을 사내에서만 써서 치료제를 개발할 수 있음
언젠가는 다른 이들도 최전선 모델에 접근할 수 있는 미래가 있길 바라지만, 증류를 통한 확산을 막는 것이 더 중요하다고 판단된다면 꼭 필요하지는 않음
[1]: https://dualuse.dev/posts/export-controls-on-fable의 증류 관련 참고

잘 모르겠는 게, 우리가 보는 증류는 중국에서만 일어나는 것처럼 보임. 영국이나 독일 등의 기술 회사들이 Claude, GPT 등을 증류하지 못하게 막는 것은 무엇인가. 단순히 능력이 부족한 건가
요지는 기술적 해법은 없을 수 있지만, 이론적으로는 정치적 해법이 있을 수 있다는 것임

모델이 계속 발전하는 한 증류 모델은 필연적으로 뒤처짐. 모델은 계속 발전 중임. 언젠가 미래에는 끝날 수도 있음
Berkeley의 “False Promise of Imitating Proprietary LLMs”도 모방이 스타일 격차는 빠르게 줄이지만, 능력 격차는 크게 남는다고 봤음 https://arxiv.org/abs/2305.15717

Anthropic “Alibaba가 Claude AI 모델 역량을 불법 추출”

요약

핵심 포인트

댓글