패치 릴리스 v5.8.1
요약
이번 패치 릴리스 v5.8.1은 주로 Deepseek V4 통합 관련 버그 수정을 목적으로 합니다. 주요 수정 사항으로는 ContinuousBatchingManager의 fatal_error 처리 추가, WeightConverter의 shared_experts 매칭 오류 수정, 그리고 Deepseek V4 자체 및 csa mask collapse 문제에 대한 여러 개선 작업이 포함되어 있습니다.
핵심 포인트
- ContinuousBatchingManager에 fatal_error 처리가 추가되었습니다.
- WeightConverter가 shared_experts를 experts로 잘못 매칭하는 문제가 수정되었습니다.
- Deepseek V4 관련 전반적인 버그 수정 및 안정화 작업이 진행되었습니다.
- Deepseek v4의 csa mask collapse 문제를 해결했습니다.
Patch release v5.8.1
이번 릴리스는 주로 Deepseek V4 통합을 수정하기 위함입니다!!!
- [fix] ContinuousBatchingManager에 fatal_error를 추가하여 서빙... (by @qgallouedec, @remi-or)
- WeightConverter가 shared_experts를 experts로 잘못 매칭하는 것을 수정함 (by @silencelamb, @claude)
- deepseek v4를 수정함 (by @ArthurZucker (#45892))
- Deepseek v4 csa mask collapse를 수정함 (by @ArthurZucker, @Sawyer117 (#45928))
AI 자동 생성 콘텐츠
본 콘텐츠는 HuggingFace Transformers Releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기