ReAligned-Qwen3.5 출시
요약
Eric Hartford와 Lazarus AI가 ReAligned-Qwen3.5 모델 시리즈를 출시했습니다. 이 모델은 중국의 이데올로기적 편향과 검열, 거부 행동을 줄이기 위해 SFT와 GRPO 파이프라인을 사용하여 미세 조정되었습니다.
핵심 포인트
- 중국의 이데올로기적 편향 및 검열 완화 목적
- SFT 및 GRPO 보상 신호를 활용한 미세 조정
- Apache 2.0 라이선스로 제공되는 오픈 소스 모델
- 0.8B부터 35B까지 다양한 파라미터 사이즈 지원
Dolphin 및 Samantha의 제작자인 Eric Hartford와 Lazarus AI가 ReAligned-Qwen3.5 모델 시리즈의 출시를 발표했습니다.
Apache 2.0 라이선스로 제공되며, 중국의 이데올로기적 편향 (ideological bias) 및 검열 (censorship), 거부 행동 (refusal behavior), 그리고 국가적 서사 프레이밍 (state-narrative framing)을 줄이도록 미세 조정 (finetuned)되었습니다.
저는 중국의 검열 및 편향 분류 체계 (taxonomy)를 타겟팅하도록 제작된 데이터셋과 함께, GRPO 보상 신호 (reward signal)로서 저의 ReAligned 분류기 (classifier) 모델을 사용하는 SFT + GRPO 파이프라인 (pipeline)을 사용했습니다.
HuggingFace에 게시되었습니다.
0.8B, 2B, 4B, 9B, 27B, 35B-A3B
BF16, FP8, GGUF
블로그:
https://lazarusaie.com/blog/introducing-realigned-open-source-frontier-models-without-the-propaganda
Huggingface 컬렉션:
https://huggingface.co/collections/Lazarus-Ai/realigned-qwen35
GGUF 모델 카드 템플릿은 Bartowski로부터 염치없이 가져왔습니다.
https://huggingface.co/Lazarus-Ai/ReAligned-Qwen3.5-27B-GGUF
모두 사랑합니다!
AI 자동 생성 콘텐츠
본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기