중국이 OpenAI와 Anthropic의 최고 폐쇄형 모델에 필적하는 오픈 소스 AI 모델을 출시했습니다. Gavin Baker는 그 방법이
요약
중국 Z. AI가 OpenAI와 Anthropic의 폐쇄형 모델에 필적하는 오픈 소스 모델 GLM 5.2를 출시했습니다. 이 모델은 지식 증류(distillation) 기술을 통해 높은 성능을 확보했으며, 자체 강화학습이 가능한 수준에 도달하여 기술 격차를 빠르게 좁히고 있습니다.
핵심 포인트
- GLM 5.2는 7,440억 파라미터와 100만 토큰 컨텍스트를 지원함
- 지식 증류(distillation)를 통해 프런티어 모델의 추론 과정을 학습함
- 자체 강화학습이 가능해져 미국 모델에 대한 의존도가 낮아짐
- 오픈 웨이트 모델의 급격한 발전이 기술 패권 경쟁을 가속화함
중국이 OpenAI와 Anthropic의 최고 폐쇄형 (closed) 모델에 필적하는 오픈 소스 (open source) AI 모델을 방금 출시했습니다. Gavin Baker는 그들이 어떻게 이를 해냈는지 정확히 설명했으며, 그 답은 모든 미국 AI 연구소들이 우려해야 할 내용입니다.
이 모델의 이름은 GLM 5.2입니다. Z. AI에 의해 구축되었습니다.
7,440억 개의 파라미터 (parameters), 100만 토큰 컨텍스트 윈도우 (context window)를 제공하며 MIT 라이선스를 따릅니다. 이는 아무런 제한이나 Dario 없이 누구나 이를 다운로드하고, 포크 (fork)하고, 이를 기반으로 회사를 설립할 수 있음을 의미합니다.
이 모델은 Artificial Analysis 지능 지수에서 51점을 기록했습니다. 이는 어떤 오픈 웨이트 (open weight) 모델이 달성한 것 중 가장 높은 점수입니다.
이 모델은 프런티어 소프트웨어 엔지니어링 벤치마크 (frontier software engineering benchmark)에서 GPT 5.5를 이겼습니다. Claude Opus 4.8에는 1% 미만의 차이로 뒤처져 있습니다. 그리고 유사한 성능을 기준으로 GPT 5.5보다 실행 비용이 85% 더 저렴합니다.
Gavin Baker는 All-In 팟캐스트에서 이 모델이 자신의 신념 중 일부를 뒤흔들었다고 말했습니다. 그런 다음 그는 중국이 어떻게 이 모델을 구축했는지 설명했습니다.
그 방법은 증류 (distillation)라고 불립니다.
수만 대의 전화기와 컴퓨터가 동시에 작동하며, 모두 마스킹된 계정 (masked accounts)을 통해 프런티어 모델 API를 호출하여 특정 질문을 던지고, 모델이 답변할 때 내부에서 일어나는 일을 수집한다고 생각해보십시오. 모든 추론 단계 (reasoning step), 모든 토큰 (token). 전체 사고 과정이 기록되어 훈련 (training) 중에 중국 모델에 다시 입력됩니다.
이것은 커닝 페이퍼 (cheat sheet)입니다. 시험의 정답지입니다.
그리고 여기 모두가 걱정해야 할 부분이 있습니다.
Sacks는 명확하게 말했습니다. 중국은 이미 미국 모델보다 9개월 뒤처져 있었습니다. 하지만 이제 GLM 5.2가 자체적인 강화학습 (reinforcement learning)을 실행할 수 있을 만큼 충분히 좋아졌기 때문에, 더 이상 미국 모델로부터 증류 (distill)할 필요 없이 스스로를 개선할 수 있습니다. 커닝 페이퍼 덕분에 그들은 스스로 답을 쓰기 시작할 수 있을 만큼 충분히 가까워졌습니다.
Sacks는 우리가 모델 측면에서는 6개월 뒤처져 있고 실리콘 (silicon) 측면에서는 24개월 뒤처져 있지만, 그들은 전체적으로 단 몇 달만 뒤처져 있을 뿐이라고 말했습니다.
Z. AI의 창립자는 Elon Musk에게 오픈 웨이트 (open weight) 모델이 GPT-4 수준의 능력을 갖추게 되는 시점이 2027년 1분기 전이 될 것이라고 직접적으로 말했습니다.
Anthropic이 로비했던 모든 규제, 스스로 부과한 모든 안전 가드레일 (safety guardrail), 그리고 미국의 프론티어 모델 (frontier models) 출시를 지연시킨 모든 한 달의 시간이 이 과정을 가속화했습니다. 중국의 연구소들은 그러한 규제 아래에 있지 않았습니다. 그들은 기다리지 않을 것이었습니다.
모든 기업이 자신들의 미세 조정된 (fine-tuned) 오픈 웨이트 (open weight) 모델과 함께 프론티어 모델을 병행하여 실행하는, Gavin이 설명한 구성 가능한 (composable) 모델의 미래는 미국의 연구소들이 다음에 무엇을 하든 상관없이 다가오고 있습니다.
문제는 단지 그 스택 (stack)의 오픈 웨이트 절반이 미국산인지 아니면 중국산인지의 여부뿐입니다.
현재는 중국산입니다.
@theallinpod에서 전체 팟캐스트를 시청하세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 X 토픽: Benchmark의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기