
Ai2가 Hugging Face에 MolmoMotion을 출시했습니다
요약
Ai2가 비디오와 언어 지시문을 통해 3D 포인트 궤적을 예측하는 4B 규모의 비전-언어 모델인 MolmoMotion을 Hugging Face에 출시했습니다. 이 모델은 객체의 시간적 공간 움직임을 예측하는 데 특화되어 있습니다.
핵심 포인트
- Ai2의 새로운 4B 비전-언어 모델 MolmoMotion 출시
- 비디오와 언어 지시문을 통한 3D 포인트 궤적 예측 가능
- 시간 경과에 따른 객체의 공간적 움직임 예측 기능 제공
Ai2가 Hugging Face에 MolmoMotion을 출시했습니다.
비디오와 언어 지시문 (language instructions)으로부터 3D 포인트 궤적 (3D point trajectories)을 예측하여, 시간이 지남에 따라 공간에서 객체가 어떻게 움직이는지 예측하는 4B 비전-언어 모델 (vision-language model)입니다. https://t.co/DvgU1AvRyq
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기