폐쇄형 모델 제공업체가 모델 추론 외에 무엇을 추가로 수행하는지 알 수 없기 때문에, 폐쇄형 모델과 오픈 모델 사이의 격차는 흔히 가정하는

벤치마크에서 Claude가 GLM-5.2를 압도할 때, 보통 Anthropic이 경쟁사보다 더 나은 모델 아키텍처 (model architectures), 우수한 학습 파이프라인 (training pipelines), 그리고 다른 고급 머신러닝 (machine learning) 기술을 보유하고 있기 때문이라고 가정합니다.

하지만 실제로는 그렇지 않습니다. 왜냐하면 벤치마크는 GLM의 모델 추론 (model inference)과 Claude 제품 전체를 비교하는 것이며, 우리는 그 제품이 배후에서 무엇을 하는지 알 수 없기 때문입니다.

Anthropic은 이미 추론 과정 (reasoning traces)을 편집하여 공개하지 않으며, 전체 대화 내용에 대한 접근 권한도 주지 않습니다. 그들은 다음과 같은 기술들을 매우 쉽게 사용하고 있을 수 있습니다:

소프트웨어 문서 등을 위한 RAG/지식 주입 (knowledge injection)
프롬프트 전처리 (Prompt preprocessing)
문맥 의존적 시스템 프롬프트 (Context-dependent system prompts)
숨겨진 내부 도구 호출 (Hidden internal tool calls)
"Clown-car MoE" / 특화된 전문가 모델로의 외주 호출 (shelling out to specialized expert models)

이 모든 것들은 모델의 성능을 극적으로 향상시킬 수 있으며, API를 통해 이 모든 과정을 "Claude"라는 이름으로 제공할 수 있습니다. 당신은 이를 알 수 없으며, Claude를 오픈 모델과 벤치마킹할 때 사실상 사과와 오렌지를 비교하는 격이 됩니다.

그들이 추론 출력 결과만으로는 오픈 모델을 이기는 단 하나의 모델도 가지고 있지 않을 가능성도 충분히 있습니다.

submitted by /u/-p-e-w- to r/LocalLLaMA
[link] [comments]

Insights

폐쇄형 모델 제공업체가 모델 추론 외에 무엇을 추가로 수행하는지 알 수 없기 때문에, 폐쇄형 모델과 오픈 모델 사이의 격차는 흔히 가정하는

요약

핵심 포인트

댓글

Lime, 주당 27달러로 상장 시작; CEO는 '적절한 시기'에 IPO가 이루어졌다고 밝혀

Depth Anything V2를 사용하여 단일 이미지에서 깊이 추정

Markmap MCP Server는 Markdown 텍스트를 내보내기 기능이 지원되는 대화형 마인드맵으로 변환합니다

실제로 유용한 50개의 GitHub 저장소

Depth Anything V2를 사용하여 단일 이미지에서 깊이 추정

Markmap MCP Server는 Markdown 텍스트를 내보내기 기능이 지원되는 대화형 마인드맵으로 변환합니다

실제로 유용한 50개의 GitHub 저장소