본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 25. 07:56

NVIDIA가 Hugging Face에 NVFP4 양자화된 MiniMax-M3를 출시했습니다

요약

NVIDIA가 Hugging Face를 통해 NVFP4 양자화 기술이 적용된 MiniMax-M3 모델을 출시했습니다. 이 모델은 428B 파라미터의 멀티모달 MoE 구조로, Blackwell GPU에서 메모리 효율을 극대화하며 NatureBench를 통해 성능을 검증합니다.

핵심 포인트

  • NVFP4 양자화를 통해 Blackwell GPU에서 메모리 2배 절감 가능
  • 428B 파라미터 규모의 멀티모달 MoE 모델
  • 1M 토큰의 대규모 컨텍스트 윈도우 지원
  • NatureBench를 통한 과학 분야 태스크 성능 검증

NVIDIA가 Hugging Face에 NVFP4 양자화 (NVFP4-quantized)된 MiniMax-M3를 출시했습니다.

428B 파라미터 멀티모달 MoE (Mixture of Experts) 모델이며,

1M-토큰 컨텍스트 윈도우 (context window)를 갖추고 있습니다.

현재 4-bit 정밀도로 압축되어

Blackwell GPU에서 2배의 메모리 절감이 가능합니다.

NatureBench

6개의 과학 분야에 걸친 Nature 계열 출판물의 90개 태스크 (tasks)를 다룹니다.

프런티어 코딩 에이전트 (Frontier coding agents)들이 발표된 SOTA (State-of-the-Art) 결과들과 비교 테스트됩니다.

그들이 새로운 솔루션을 발견할 수 있을까요, 아니면 기존의 것들을 재현할 뿐일까요?

가장 강력한 에이전트조차 단 17.8%의 태스크에서만 SOTA를 능가합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0