본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 30. 06:18

NVIDIA가 Hugging Face에 양자화된 Qwen3.6 MoE 모델을 출시했습니다

요약

NVIDIA가 Hugging Face를 통해 양자화된 Qwen3.6 MoE 모델과 최적화된 Kokoro TTS 모델을 출시했습니다. Qwen3.6 모델은 NVFP4 기술을 통해 메모리를 3배 절감하며 멀티모달 입력을 지원합니다.

핵심 포인트

  • Qwen3.6 MoE: 35B 파라미터, 활성 3B 파라미터 모델
  • NVFP4 적용으로 메모리 사용량 약 3배 절감 및 정확도 유지
  • 텍스트, 이미지, 비디오를 지원하는 멀티모달 및 262K 컨텍스트
  • Hopper 및 Blackwell 아키텍처의 vLLM에서 즉시 사용 가능
  • 82M 파라미터의 가벼운 Kokoro TTS 모델 출시

NVIDIA가 Hugging Face에 양자화된 (quantized) Qwen3.6 MoE 모델을 출시했습니다.

총 35B 파라미터, 활성 (active) 파라미터 3B

NVFP4는 정확도 손실을 거의 없이 메모리를 약 3배 줄여줍니다.

멀티모달 (Multimodal) 입력: 텍스트, 이미지, 그리고 비디오

최대 262K 컨텍스트 (context)

Hopper 및 Blackwell 아키텍처의 vLLM에서 즉시 사용 가능합니다.

NVIDIA가 Hugging Face에 최적화된 Kokoro TTS 모델 버전을 출시했습니다.

상업적 이용이 가능한 가벼운 82M 파라미터 음성 합성기 (speech synthesizer)로, ONNX Runtime을 통해 NVIDIA GPU에서 빠르게 실행됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0