World from Motion: 단안 비디오로부터의 생성적 동적 가우시안 재구성 (Generative Dynamic Gaussian

우리는 단안 비디오(monocular videos)로부터 자유롭게 렌더링 가능한 동적 3D 가우시안(3D Gaussian) 표현을 생성하는 방법론인 World from Motion을 제시합니다. 우리의 접근 방식은 비디오 모델이 입력 및 타겟 카메라 궤적(camera trajectories)을 따라 외관(appearance), 기하학적 구조(geometry), 그리고 3D 장면 움직임(3D scene motion)을 인코딩하는 조밀하고 픽셀 정렬된 렌더링(pixel-aligned renderings)을 조건으로 사용하도록 하여, 렌더링 아티팩트(rendering artifacts)를 수정하고 초기 재구성에서 누락된 영역을 채웁니다. 이 모델을 학습시키기 위해, 우리는 단안 재구성의 특징적인 시뮬레이션된 아티팩트가 포함된 정렬된 다중 뷰 비디오 쌍(multiview video pairs)과 동적 3DGS 표현으로 구성된 데이터셋을 구축합니다. 테스트 시에는 새롭게 관찰된 영역과 움직임을 포함한 모델의 생성물을 단일하고 일관된 고품질 동적 3DGS로 증류(distill)하여, 새로운 시점 합성(novel-view synthesis)과 근본적인 3D 움직임을 모두 개선합니다. 우리의 방법은 4D 재구성(4D reconstruction) 분야에서 새로운 SOTA(state of the art)를 기록하며, 시점 변화가 크고 동적인 움직임이 있는 야생(in-the-wild) 비디오에도 매끄럽게 일반화됩니다.

Insights

World from Motion: 단안 비디오로부터의 생성적 동적 가우시안 재구성 (Generative Dynamic Gaussian

요약

핵심 포인트

댓글

SAIR 팟캐스트: 타오쩌쉬안, AI 시대의 '증명 소화불량'과 경쟁 새 패러다임

Active Energy, UAE 자산 수익 창출 시작과 함께 전략적 재편 완료

Intrusion, 사이버 보안 기업 VigilAigent 인수 추진

토큰화 (Tokenisation) 규제가 구축됨에 따라 Valereum은 상업 운영 단계로 진입

Active Energy, UAE 자산 수익 창출 시작과 함께 전략적 재편 완료

Intrusion, 사이버 보안 기업 VigilAigent 인수 추진

토큰화 (Tokenisation) 규제가 구축됨에 따라 Valereum은 상업 운영 단계로 진입