Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
r/LocalLLaMA (top/week) 2건필터 해제
r/Local분석
Qwen3.6-35B-A3B-Uncensored-Genesis-APEX-MTP
Qwen3.6-35B 기반의 Uncensored Genesis 모델 릴리즈 소식입니다. MTP 양자화 기술을 통해 비검열 기능을 제공하며, 대규모 컨텍스트에서도 안정적인 성능을 보여줍니다.
1시간 전0
r/Local분석
Orthrus-Qwen3-8B: Qwen3-8B에서 최대 7.8배 토큰/순전파 달성, 백본 고정 및 출력 분포 증명 동일
Orthrus-Qwen3-8B는 고정된 AR Transformer 레이어에 학습 가능한 확산 어텐션 모듈을 주입하여 추론 속도를 혁신적으로 개선한 모델입니다. 백본을 고정함으로써 기존 확산 언어 모델과 달리 정확도 손실 없이 Qwen3-8B와 동일한 출력 분포를 유지하며, MATH-500 벤치마크에서 최대 7.8배의 TPF(Tokens Per Forward)를 달성했습니다.
4일 전0
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.