
【심층 분석】 GLM-5.2가 재편한 코딩 세력도 — Fable 5가 사라진 지금, 최강의 '실용적' 모델은 중국제였다
요약
Zhipu AI의 GLM-5.2가 1M 토큰 컨텍스트와 MIT 라이선스를 바탕으로 강력한 코딩 모델로 부상했습니다. 미국의 수출 규제로 Fable 5의 접근이 제한된 상황에서, GLM-5.2는 높은 성능과 낮은 비용을 앞세워 실용적인 대안으로 주목받고 있습니다.
핵심 포인트
- GLM-5.2는 1M 토큰 컨텍스트와 MIT 라이선스 오픈 웨이트 모델임
- MoE 아키텍처를 통해 744B 파라미터 중 40B만 활성화하여 효율성 극대화
- Claude Code, Cursor 등 주요 코딩 도구와 호환되며 비용은 Fable 5의 1/10 수준
- 리포지토리 규모의 대규모 코드베이스 및 장시간 에이전트 작업에 특화
최근 2편의 기사를 통해 프론티어 모델(Frontier Model)의 부재에 대해 써왔다.
- Anthropic 최강의 Fable 5는 미국의 수출 규제로 인해 외국 국적 사용자로부터 차단되었다 (일본인은 사용할 수 없다) - Sakana의 Fugu Ultra는 벤치마크는 강력하지만, 실제 사용 시 레이턴시(Latency)와 비용이 무거워 일상적인 주력 모델로는 아직 거리가 멀다
그렇다면, 지금 실제로 손에 닿는 범위에서 최강의 코딩 모델은 무엇인가.
정답은 중국 Zhipu AI(Z.ai)의 GLM-5.2다. MIT 라이선스의 오픈 웨이트(Open Weights). 지역 제한 없음. 그리고 월 $18부터, Claude Code 안에 그대로 끼워 넣어 사용할 수 있다.
아이러니한 구도다. 미국이 자국의 최강 모델을 폐쇄한 결과, 세계에서 가장 '누구나 사용할 수 있는' 최전선 코딩 모델이 오픈된 중국제가 되었다. 이 기사에서는 그 실태를 아키텍처(Architecture), 벤치마크(Benchmark), 비용, 클라우드 에이전트 기반의 4가지 축으로 심층 분석한다.
GLM-5.2(2026년 6월 13일 공개)는 1M 토큰 컨텍스트(Context) + MIT 라이선스의 오픈 웨이트(Open Weights). 리포지토리(Repository) 규모 및 장시간 에이전트 작업에 특화 -
Code Arena에서 2위(1,595점). 그리고 '실제로 사용할 수 있는 모델 중에서는 사실상 톱' —— 왜냐하면 1위급이었던 Fable 5가 수출 규제로 인해 랭킹에서 제외되었기 때문 -
GLM Coding Plan은 월 $18~$160. Claude Code, Cline, OpenCode, Cursor, Aider 등 주요 하네스(Harness)에서 동작. 플래닝(Planning) 태스크에서 Fable 5의 9.1 대비 9.0을 기록하며, 비용은 약 1/10 -
아키텍처는 744B 파라미터 / 40B 액티브(Active)의 MoE(256 엑스퍼트(Expert)). MLA + DeepSeek Sparse Attention으로 장문 계산량을 1.5~2배 절감 -
단, 주의점도 있다: 쿼터(Quota) 배율이 UTC+8 기준으로 복잡하며, 가장 난도가 높은 영역에서는 여전히 클로즈드(Closed) 프론티어 모델에 한 수 밀리고, 중국제 프로바이더의 데이터 취급은 검토가 필요하다.
본 기사는 공개된 기술 리포트(arXiv), 각사의 비교 기사, 공식 정보를 바탕으로 한 분석입니다. 벤치마크는 조건부 수치이며, 최종 판단은 귀하의 워크로드(Workload)에서 직접 측정하는 것을 권장합니다.
GLM-5 패밀리의 계보는 다음과 같다.
| 버전 | 공개일 | 주요 변화 |
|---|---|---|
| GLM-5.1 | 2026년 4월 7일 | 장시간 에이전트 특화 플래그십 |
| GLM-5.2 | 2026년 6월 13일 | 컨텍스트를 200K에서 1M으로 확장, MIT 라이선스로 가중치 공개 |
GLM-5.2의 설계 사상은 명확하다. 원샷(One-shot) 코드 완성(Code Completion)이 아니라, 리포지토리 규모의 개수 및 장시간의 에이전트 작업에 초점을 맞추고 있다. 1M 토큰의 컨텍스트는 거대한 코드베이스나 검색이 많은 워크플로우를 통째로 수용하기 위한 것이다.
그리고 결정적인 것은 라이선스다. 유료 코딩 고객에게 선제적으로 제공한 후, MIT 라이선스로 가중치(Weights)를 공개했다. 이용 제한 없음, 지역 제한 없음. Fable 5가 국경에 막힌 것과는 정반대의 전략이다.
기술 리포트(arXiv:2602.15763)를 통해 GLM-5의 내부를 파헤쳐 본다.
총 파라미터: 744B
액티브(Active): 40B (MoE, 256 엑스퍼트)
레이어(Layer) 수: 80 (엑스퍼트 병렬화의 오버헤드 최소화)
...
GLM-5가 '길게 실행해도 무너지지 않는' 이유는 모델 단독의 성능이 아니라 **학습 기반(Training Infrastructure)**에 있다.
비동기 RL(Reinforcement Learning) 프레임워크: 추론 엔진과 학습 엔진을 분리하여, 긴 롤아웃(Rollout) 중의 GPU 유휴 시간을 절감 -
TITO(Token-in-Token-out) 게이트웨이: 롤아웃과 학습에서 토큰화를 완전히 일치시켜, 재토큰화(Re-tokenization)의 어긋남을 방지 -
DP-aware Routing: 멀티 턴(Multi-turn)에서 KV 캐시(KV Cache)의 재사용을 최대화 -
1만 개 이상의 검증 가능한 SWE·터미널 환경에서 에이전트 RL 실시
도구 설계는 "search / open / find / python" 4가지다. 컨텍스트가 32k를 넘으면 오래된 관측치를 접는 'keep-recent-k' 전략과 계층적 리셋을 병용한다. 이 사소한 노력이 BrowseComp 스코어를 베이스라인 55.3%에서 **75.9%**로 끌어올렸다.
| 벤치마크 | GLM-5의 위치 | 보충 |
|---|---|---|
| SWE-bench Verified | 오픈 소스 진영 1위 | 엔드 투 엔드 (End-to-End) SWE 태스크 |
| Terminal-Bench 2.0 | 오픈 소스 진영 톱 | 장시간 에이전트 평가 |
| LMArena Code | 오픈 소스 진영 1위 | 인간 판정 |
| Intelligence Index v4.0 | 50점 | 오픈 웨이트 (Open Weights) 모델 최초 50점 도달 (GLM-4.7은 42점) |
| Vending-Bench 2 | 최종 $4,432 | 장기 비즈니스 시뮬레이션 |
그리고 서두의 핵심. Code Arena에서는 2위(1,595점). 하지만 이 '2위'는 1위급이었던 Fable 5가 수출 규제로 인해 랭킹에서 제외된 결과다.
즉—— "지금 실제로 접근 가능한 모델 중에서는, GLM-5.2가 사실상의 최상위"라는 상태가 만들어지고 있다.
오해하지 않았으면 한다. 이것은 "GLM-5.2가 세계 최강"이라는 의미가 아니다. 클로즈드 (Closed) 프론티어(규제 전의 Fable 5나 Mythos)에는 가장 난도가 높은 영역에서 미치지 못한다. 정확하게는 "손에 닿는 범위 내에서의 최강"이다. 규제가 만들어낸 상대적인 왕좌라는 점을 잊지 말 것.
2026년, 코딩 에이전트 구독은 주요 4개 진영으로 정리되었다.
| 플랜 | 월간 요금 | 특징 |
|---|---|---|
| Claude Pro | $20 | Claude Code에 네이티브 |
| ... |
주목할 점은 인프라 계층의 진화다. Anthropic의 Claude Managed Agents는 에이전트 루프(Agent Loop), 도구 실행, 런타임(Runtime)을 직접 구축하지 않아도, **매니지드 샌드박스 (Managed Sandbox)**를 통해 Claude가 파일 조작, 명령 실행, 웹 브라우징, 코드 실행을 할 수 있게 해준다. 영구 파일 시스템과 대화 기록을 가진 스테이트풀 (Stateful) 세션이 표준이 되었다.
Google도 6월 18일에 Gemini CLI를 Antigravity로 이전했다. 기존 CLI 의존형 워크플로우는 재작성이 필요해졌다. 클라우드 측에서 에이전트를 실행하는 방향으로 각 기업이 일제히 키를 틀고 있다.
GLM이 흥미로운 점은, 타사의 하네스 (Harness)에 기생할 수 있다는 점이다. 전용 앱을 사용하게 만드는 것이 아니라, 기존 도구에 모델만 끼워 넣는다.
Claude Code: API 엔드포인트 (Endpoint) 경유 -
Cline / OpenCode / Cursor: OpenAI 호환 엔드포인트 -
Kilo Code / Aider: 직접 대응
Claude Code에 끼워 넣을 경우, Anthropic 호환 엔드포인트로 향하게 하는 것이 기본이다 (정확한 절차는 z.ai 공식 문서 참조).
# GLM Coding Plan의 키를 Claude Code에 입력하는 예시
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="<GLM_CODING_PLAN_KEY>"
...
| 티어 | 월간 요금 | 5시간당 |
|---|---|---|
| Lite | $18 | 약 80 프롬프트 |
| ... |
종량제 과금은 **입력 $1.40 / 출력 $4.40 (100만 토큰)**이다. 플래닝 (Planning) 태스크에서는 Fable 5의 9.1에 대해 GLM-5.2가 9.0으로, 비용은 약 1/10이라는 비교도 있다.
쿼터 (Quota) 배율은 주의해야 한다. 피크 시간(UTC+8의 14:00~18:00)에는 3배 소비되며, 오프 피크 (Off-peak) 시간에도 통상 2배다. 2026년 9월까지의 프로모션(Promo)으로 오프 피크 1배라는 안내도 있지만, 이 배율은 타임존(Timezone)에 의존하므로 파악하기 어렵다. 일본(UTC+9) 기준으로는 피크 시간이 낮 시간과 겹치기 때문에, 실효 비용은 표의 액면가 그대로 나오지 않는다.
실효 프롬프트 수 ≒ 표시 쿼터 ÷ 시간대 배율 (1~3배)
증거에 기반한 현실적인 해답은 다음과 같다.
GLM이 적합한 경우
- 일상적인 CRUD, 구현, 리팩터링(Refactoring) 등 양이 많은 작업 (비용이 1자리수 차이)
- 거대 리포지토리(Repository) 로드 (1M 컨텍스트)
- Claude의 한계에 도달했을 때의 확장처 ($100 초과 플랜으로 올리는 것보다 저렴)
- 오픈 웨이트 (Open Weights)를 자체 호스팅하고 싶은 조직
Claude (Opus 4.8 등)가 적합한 경우
- 가장 어려운 설계 판단, 미묘한 뉘앙스가 필요한 작업
- 리뷰나 실무(Production)에 직결되는, 품질 최우선 태스크
주의해서 사용해야 할 상황
민감한 코드 및 사내 데이터: 중국계 프로바이더의 API로 전송하기 전에 데이터 취급 방식과 컴플라이언스(Compliance)를 반드시 확인하십시오. - 규제 및 지정학적 리스크: 오픈 웨이트 (Open-weight) 모델이라면 자체 호스팅을 통해 회피할 수 있으나, API 이용 시에는 정책 변경 가능성을 염두에 두어야 합니다.
| 관점 | 평가 |
|---|---|
| 실제 액세스 가능성 | 최고 (MIT, 지역 제한 없음) |
| ... |
2026년 상반기에 일어난 일을 한 마디로 요약하자면——미국이 프론티어 (Frontier)를 닫아버린 틈을 타, 오픈 웨이트 (Open-weight) 중국제 모델이 '실용적 프론티어'를 탈취했다.
일본 개발자들에게 주는 시사점은 실용적입니다. Fable 5는 사용할 수 없습니다. Fugu Ultra는 아직 무겁습니다. 그렇다면, 지금 당장 손에 쥘 수 있는 가장 비용 효율적인 코딩 에이전트(Coding Agent)는 GLM-5.2이며, 심지어 익숙한 Claude Code 안에 그대로 끼워 넣을 수 있습니다.
단, '저렴하고 강력하다'는 이면에는 데이터를 어디로 보낼 것인가라는 질문이 남습니다. 성능·비용·컴플라이언스 (Compliance)의 삼각형을 자신의 워크로드(Workload)에 대입하여 판단하시기 바랍니다.
이 기사가 도움이 되었다면, 좋아요와 저장을 부탁드립니다!
GLM-5.2를 Claude Code에 연결해서 사용하고 계신가요? 실제 체감되는 쿼터(Quota)를 댓글로 알려주세요.
GLM-5: From Vibe Coding to Agentic Engineering (GitHub)
GLM-5 Technical Report (arXiv)
Zhipu AI's stock rockets after Chinese firm makes GLM-5.2 open source - South China Morning Post
Claude Code vs Codex vs Gemini CLI vs GLM-5.2: 2026 Plan Comparison - explainx.ai
Claude Managed Agents overview - Claude Platform Docs
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기