GLM 5.2 API 출시, 가중치는 HuggingFace에 공개되었으며 Ollama에서도 사용 가능
요약
GLM 5.2가 API 출시와 함께 HuggingFace에 MIT 라이선스로 가중치가 공개되었습니다. Ollama를 통해 로컬 실행이 가능하며, 높은 벤치마크 성능과 합리적인 API 가격을 갖춘 오픈 가중치 모델입니다.
핵심 포인트
- HuggingFace 가중치 공개 및 Ollama 지원으로 로컬 실행 가능
- High/Max 두 가지 사고 모드 제공 및 1M 컨텍스트 지원
- SWE-bench 등 주요 벤치마크에서 경쟁력 있는 성능 기록
- 합리적인 API 가격으로 단순 반복 작업(로그 추출, 요약 등)에 유용
GLM 5.2가 지난 금요일 GLM Coding Plan에 묶인 채 출시되었습니다. 다른 IDE 티어에 구독하지 않고 단순히 테스트만 하고 싶었던 사람들에게는 짜증스러운 일이었습니다.
오늘 두 시간 전, 그들은 API를 개방하고 MIT 라이선스로 HuggingFace에 가중치 (weights)를 게시했습니다. Ollama에는 이미 반영되어 있습니다. 따라서 이제 실제로 로컬에서 실행하거나 이미 사용 중인 어떤 게이트웨이를 통해서든 호출할 수 있습니다.
블로그를 건너뛰고 싶다면 링크:
- Weights: https://huggingface.co/zai-org/GLM-5.2
- Blog: https://z.ai/blog/glm-5.2
- Ollama: https://ollama.com/library/glm-5.2
API 가격은 입력 토큰 1M당 $1.4, 출력 토큰 1M당 $4.4로 GLM-5.1과 동일합니다. 두 가지 사고 모드 (thinking modes)인 High와 Max가 있습니다. Max는 토큰을 더 많이 소모하지만 점수를 더 높여줍니다. 1M 컨텍스트 (context)를 지원하지만, 해당 윈도우의 끝부분에서도 일관성을 유지하는지는 테스트해보지 않았습니다.
그들이 게시한 벤치마크 (Benchmarks): Terminal-Bench 2.1에서 81.0, SWE-bench Pro에서 62.1, FrontierSWE에서 74.4를 기록했습니다. Opus 4.8에는 1점 차로 뒤처지고, GPT-5.5를 1점 차로 앞섭니다. 모든 것에서 승리하기 때문이 아니라, 라우팅 (routing)을 고려할 만한 가격대에서 충분히 승리할 수 있다는 점에서 오픈 가중치 (open-weights) 모델로서 진정으로 유용한 위치에 있습니다.
제가 가장 먼저 라우팅할 작업들: 지원 로그에서 필드 추출하기, 내부 요약 초안 작성, 1차 코드 리뷰 코멘트 작성. 지루한 70%의 작업들입니다. 만약 이상한 오류 없이 일주일간 실제 트래픽을 견뎌낸다면, 범위를 넓힐 것입니다.
submitted by /u/Independent_Plum_489 to r/LocalLLaMA
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/OpenAI Codex (search)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기