Qwen 3.6 27B Abliterated (apostate)
요약
Apostate 프로젝트를 통해 Qwen 3.6 27B 모델의 안전 정렬을 제거한 모델을 Hugging Face에 출시했습니다. 모델의 성능 저하를 최소화하면서 거절률을 92%에서 7.6%로 대폭 낮추는 데 성공했습니다.
핵심 포인트
- Qwen 3.6 27B 모델의 안전 정렬(safety alignment) 제거
- 모델 성능 영향 최소화 (0.120 KL)
- 거절률을 92%에서 7.6%로 대폭 감소
저는 Apostate라는 프로젝트를 진행해 왔으며, 마침내 Hugging Face에 이 프로젝트를 활용한 첫 번째 대규모 모델을 출시했습니다. Qwen 3.6 27B 모델의 안전 정렬 (safety alignment)을 제거하여, 모델의 능력에 미치는 영향은 최소화(0.120 KL)하면서 거절률 (refusal rate)을 92%에서 7.6%로 낮추었습니다.
Qwen 3.6 27B Apostate
submitted by /u/AccountAntique9327
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기