Claude Fable-5를 증류한 Qwable-v1 공개
요약
Anthropic의 Claude Fable-5 모델을 증류하여 개발한 오픈 웨이트 모델 Qwable-v1이 공개되었습니다. Qwen3.6-35B를 기반으로 하며, Fable-5의 에이전트 코딩 흔적을 학습하여 도구 호출 능력을 갖추고 있습니다.
핵심 포인트
- Claude Fable-5의 에이전트 코딩 흔적을 증류한 Qwen3.6 기반 모델
- 실제 Claude 스타일의 도구 호출을 위한 XML 형식 생성 가능
- Glint-Research의 CoT 데이터를 활용한 14시간의 증류 과정
- Hugging Face를 통해 모델 가중치 및 SFT 데이터셋 공개
Qwable-v1을 공개합니다. 이는 Anthropic의 Mythos-class 프리뷰 모델이었던 Claude Fable-5로부터 증류(distilled)된 오픈 웨이트(open-weights) Qwen3.6-35B-A3B 모델입니다. Fable-5는 미국의 수출 통제 지침에 따라 전 세계적으로 중단되기 전, 약 4일간(~2026-06-09 → 2026-06-12) 잠시 공개되었던 모델입니다.
Fable-5는 출시 당시 Anthropic의 가장 강력한 모델이었습니다. SWE-bench Pro에서 80.3%를 기록했으며, 출력 토큰당 비용은 $50/M였습니다. 또한 API에는 사고 과정(thinking blocks)을 실시간으로 삭제하는 안티-증류(anti-distillation) 분류기가 내장되어 있었습니다. Qwable-v1은 살아남은 데이터들을 포착했습니다: CoT(Chain of Thought)가 통과된 유일한 공개 코퍼스인 Glint-Research/Fable-5-traces에서 재구성된 4,659개의 명확한 평문 에이전트 코딩 흔적(agentic-coding traces)을 단일 H200에서 약 14시간 동안 Qwen3.6에 증류했습니다. 에이전트 시스템 프롬프트가 주어지면, 이 모델은 str_replace_editor와 같은 실제 Claude 스타일의 도구를 호출하는 적절한 형식의 <tool_use> XML을 생성합니다. 즉, Fable의 스타일뿐만 아니라 도구 인터페이스(tool surface) 자체가 가중치(weights)에 유출되었습니다.
모델, GGUF(IQ4_XS / Q4_K_M / Q5_K_M / Q8_0), 그리고 SFT 데이터셋은 모두 HF에서 공개되어 있습니다 (업스트림으로부터 AGPL-3.0 라이선스 적용).
https://huggingface.co/lordx64/Qwable-v1
submitted by /u/Anony6666
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기