NVIDIA, Physical AI를 위한 옴니모달 (Omnimodal) 월드 모델 Cosmos 3 출시
요약
NVIDIA가 Physical AI를 위한 옴니모달 월드 모델인 Cosmos 3를 출시했습니다. 이 모델은 텍스트, 이미지, 비디오, 오디오 및 로봇 동작을 통합하여 추론, 생성 및 시뮬레이션이 가능합니다.
핵심 포인트
- 텍스트, 이미지, 비디오, 오디오, 로봇 동작 통합 지원
- 이미지 및 비디오 생성 분야 오픈 소스 1위 기록
- Physical AI를 위한 강력한 시뮬레이션 및 추론 능력 제공
NVIDIA가 Physical AI를 위한 옴니모달 (Omnimodal) 월드 모델인 Cosmos 3를 출시했습니다.
텍스트, 이미지, 비디오, 오디오 및 로봇 동작 (Robot actions) 전반에 걸쳐 추론, 생성 및 시뮬레이션이 가능한 단일 모델입니다.
이미지 생성, 비디오 생성 및 로봇 정책 (Robot policy) 분야에서 오픈 소스 1위를 기록했습니다.
논문 (Paper):
https://huggingface.co/papers/2606.02800
…
컬렉션 (Collection):
https://huggingface.co/collections/nvidia/cosmos3
…
코드 (Code):
https://github.com/NVIDIA/cosmos
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기