본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 30. 14:56

minWM: 실시간 상호작용형 비디오 월드 모델을 위한 최초의 풀스택 오픈소스 프레임워크

요약

실시간 상호작용이 가능한 비디오 월드 모델을 위한 최초의 풀스택 오픈소스 프레임워크인 minWM을 소개합니다. 양방향 확산 기술을 활용해 4단계만으로 카메라 제어가 가능한 환경을 구축합니다.

핵심 포인트

  • 실시간 상호작용형 비디오 월드 모델 프레임워크
  • 양방향 확산을 통한 4단계 카메라 제어 구현
  • Hugging Face를 통한 논문 및 체크포인트 공개
  • NVIDIA의 Qwen3.6 MoE 양자화 모델 출시 정보 포함

minWM

실시간 상호작용형 비디오 월드 모델 (video world models)을 위한 최초의 풀스택 오픈소스 프레임워크

양방향 확산 (bidirectional diffusion)을 4단계 만에 카메라 제어가 가능한 세계로 전환합니다.

Hugging Face에서 논문을 읽고
체크포인트 (checkpoints)를 확인하세요.

논문 (Paper):
https://huggingface.co/papers/2605.30263

모델 (Models):
https://huggingface.co/MIN-Lab/minWM
코드 (Code):
https://github.com/shengshu-ai/minWM

NVIDIA가 방금 Hugging Face에 양자화된 Qwen3.6 MoE 모델을 출시했습니다.

총 35B 파라미터 중 활성 파라미터 (active parameters)는 3B입니다.

NVFP4는 정확도 손실을 거의 없이 메모리를 약 3배 줄여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0