본문으로 건너뛰기

© 2026 Molayo

r/LocalLLaMA분석2026. 05. 03. 03:54

Unsloth 이 Mistral Medium 3.5 구현의 버그를 해결했습니다

요약

Unsloth는 Mistral과 협력하여 Mistral Medium 3.5 추론에 영향을 미치던 버그를 수정한 업데이트된 GGUF 파일을 출시했습니다. 이 문제는 YaRN 파싱의 특이성으로 인해 발생했으며, `mscale_all_dim`을 1에서 0으로 변경하는 방식으로 해결되었습니다. 또한 mmproj 파일 생성 오류 문제도 함께 수정되었습니다.

핵심 포인트

  • Mistral Medium 3.5 추론 버그가 수정된 업데이트된 GGUF 모델이 출시됨.
  • 버그의 원인은 YaRN 파싱 과정의 특이성(quirk) 때문이었음.
  • 핵심 해결책은 `mscale_all_dim` 값을 1에서 0으로 변경하는 것이었음.
  • mmproj 파일 생성 오류 문제도 함께 수정되어 사용 편의성이 높아짐.

https://unsloth.ai/docs/models/mistral-3.5

"2026 년 5 월 1 일 업데이트: Mistral Medium 3.5 추론에 영향을 미친 일부 구현을 수정하기 위해 Mistral 과 협력하여, 수정이 포함된 업데이트된 GGUF 를 출시했습니다 (이는 Unsloth 나 우리의 양자화 (quant) 와는 관련 없습니다). 이 문제는 transformers 와 llama.cpp 를 포함한 여러 구현체에 영향을 준 YaRN 파싱의 특이성 (quirk) 으로 인해 발생했습니다. mscale_all_dim 을 1 에서 0 으로 변경함으로써 문제가 해결되었습니다. 또한 mmproj 파일이 올바르게 생성되지 않는 문제도 수정했습니다."

AI 자동 생성 콘텐츠

본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
8

댓글

0