Unsloth, Mistral Medium 3.5 구현 버그 해결
요약
Unsloth는 Mistral과 협력하여 Mistral Medium 3.5 추론에 영향을 미치던 버그를 수정한 업데이트된 GGUF 파일을 출시했습니다. 이 문제는 YaRN 파싱의 특이성으로 인해 발생했으며, `mscale_all_dim`을 1에서 0으로 변경하는 방식으로 해결되었습니다. 또한 mmproj 파일 생성 오류 문제도 함께 수정되었습니다.
핵심 포인트
- Mistral Medium 3.5 추론 버그가 수정된 업데이트된 GGUF 모델이 출시됨.
- 버그의 원인은 YaRN 파싱 과정의 특이성(quirk) 때문이었음.
- 핵심 해결책은 `mscale_all_dim` 값을 1에서 0으로 변경하는 것이었음.
- mmproj 파일 생성 오류 문제도 함께 수정되어 사용 편의성이 높아짐.
[https://unsloth.ai/docs/models/mistral-3.5]
'2026년 5월 1일 업데이트: 저희는 Mistral과 협력하여 일부 구현에 영향을 미치던 Mistral Medium 3.5 추론(inference) 문제를 해결하고, 수정된 GGUF를 배포했습니다 (Unsloth 또는 당사의 양자화(quantization)와 관련 없음). 이 문제는 YaRN 파싱 오류(parsing quirk)가 transformers 및 llama.cpp를 포함한 여러 구현에 영향을 미쳐 발생했습니다. mscale_all_dim을 1에서 0으로 변경함으로써 해결되었습니다. 또한 mmproj 파일이 올바르게 생성되지 않던 문제도 수정했습니다.'
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기