
NVIDIA의 Gamma-World
요약
NVIDIA가 발표한 Gamma-World는 공유 상호작용 환경을 위한 생성형 멀티 에이전트 월드 모델입니다. 심플렉스 회전 에이전트 인코딩과 희소 허브 어텐션을 통해 다수 플레이어 환경에서도 실시간 롤아웃을 구현합니다.
핵심 포인트
- 심플렉스 회전 에이전트 인코딩 및 희소 허브 어텐션 적용
- 4명 에이전트에 대한 제로샷 일반화 및 24 FPS 실시간 구현
- GARD 기술을 통한 기하학 인지 기반 3D 재구성 복원
NVIDIA의 Gamma-World
공유 상호작용 환경을 위한 생성형 멀티 에이전트 월드 모델 (Generative multi-agent world model).
이 모델은 심플렉스 회전 에이전트 인코딩 (Simplex rotary agent encoding) 및 희소 허브 어텐션 (Sparse hub attention)을 사용하여 2명 이상의 플레이어로 확장 가능합니다.
4명의 에이전트에 대한 제로샷 일반화 (Zero-shot generalization)를 통해 실시간 24 FPS 롤아웃 (Rollouts)을 구현합니다.
저자들과 논의하기:
https://huggingface.co/papers/2605.28816
프로젝트 페이지:
https://research.nvidia.com/labs/sil/projects/gamma-world/
코드:
https://github.com/nv-tlabs/Gamma-World
...
GARD: 기하학 인지 표현 디노이징 (Geometry-Aware Representation Denoising)
3D 재구성 (3D reconstruction) 모델의 특징 공간 (Feature space) 내부에서 직접 수행되는 확산 기반 (Diffusion-based) 복원 기술입니다.
손상된 입력으로부터 깨끗한 이미지와 3D 구조를 복구하는 동안 교차 뷰 기하학 (Cross-view geometry)을 보존합니다.
픽셀 공간 (Pixel-space) 및 VAE 기반 방식보다 뛰어난 성능을 보입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기