PiG-Avatar: 계층적 Neural-Field 가이드 Gaussian Avatar
요약
PiG-Avatar는 기존 Gaussian avatar 방식이 가진 신체 템플릿 의존적 기하학 제약을 해결하기 위해 제안된 새로운 방법론입니다. 파라메트릭 신체 모델을 운동학적 전달 용도로만 제한하고, avatar를 연속적인 neural field로 제어되는 볼륨형 정준 공간의 Gaussians로 표현하여 복잡한 의류와 비강체 움직임을 정교하게 캡처합니다. 이를 통해 고충실도의 렌더링 품질과 실시간 성능을 동시에 달성했습니다.
핵심 포인트
- 신체 템플릿 위상과 avatar 표현을 분리하여 의류 및 비강체 기하학 표현의 한계 극복
- 3D barycentric anchor transport를 통한 운동학적 일관성 유지 및 자유로운 기하학적 변형 지원
- Sobolev-preconditioned neural-field와 KNN 기반 프리컨디셔닝을 결합한 이중 수준 공간적 일관성 최적화 도입
- 명시적 휴리스틱 없이도 곡률이 높거나 복잡한 영역으로 anchor가 스스로 이동하는 자기 조직화 유도
- 다중 세부 수준(multiple levels of detail)의 계층적 재구성을 통한 실시간 고충실도 렌더링 구현
기존의 Gaussian avatar 방법들은 일반적으로 신체 템플릿 표면(body-template surface) 위에 기하학적 구조를 매개변수화하며, 이는 avatar의 표현 공간(representation space)을 템플릿의 변형 공간(deformation space)과 얽히게 만들어 층이 있는 구조, 신체 외부(off-body), 그리고 비강체(non-rigid) 의류 기하학의 캡처를 제한합니다. 우리는 이러한 한계를 해결하기 위해, 파라메트릭 신체 모델(parametric body model)을 오직 운동학적 전달(kinematic transport)을 위해서만 사용하고, avatar를 연속적인 neural field에 의해 제어되는 볼륨형 정준 공간(volumetric canonical space)에 고정된 Gaussians로 표현하는 PiG-Avatar를 제안합니다. 이는 표현을 템플릿 위상(template topology)으로부터 분리하여, 표면 기반 매개변수화(surface-based parameterizations)의 기하학적 제약을 피할 수 있게 합니다. 운동학적 일관성(Kinematic coherence)은 3D barycentric anchor transport를 통해 유지되는데, 이는 기하학을 제약하지 않으면서 움직임을 가이드하며 anchor가 템플릿 표면으로부터 자유롭게 벗어날 수 있도록 하여, 구조적으로 조밀하고 안정적인 시간적 표면 대응(temporal surface correspondences)을 생성합니다. 이러한 제약 없는 공식을 다루기 쉽게 만들기 위해, 우리는 Sobolev-preconditioned neural-field 업데이트와 새로운 KNN 기반의 정준 anchor 기하학 프리컨디셔닝(preconditioning)을 결합한 이중 수준의 공간적 일관성 최적화(dual-level spatially coherent optimization)를 도입합니다. 이러한 메커니즘들은 함께 anchor 밀도의 창발적 자기 조직화(emergent self-organization)를 유도합니다. 즉, anchor는 명시적인 휴리스틱 없이도 곡률이 높거나, 외관 변화가 심하거나, 비일관적인 움직임이 있는 영역으로 이동합니다. 그 결과, 복잡한 의류 기하학 및 층이 있는 표면이 자연스럽고 고충실도(high-fidelity)의 출력물로 나타납니다. 이 단일 표현은 또한 공유된 field와 결합된 anchor graph를 통해 거친 수준(coarse-level)의 감독(supervision)이 더 미세한 수준으로 전파되는 다중 세부 수준(multiple levels of detail)에 걸친 계층적 재구성(hierarchical reconstruction)을 지원합니다. 복잡한 의류와 까다로운 비강체 움직임을 가진 피사체를 포함하는 기존 벤치마크에서, PiG-Avatar는 최첨단(state-of-the-art) 렌더링 품질을 달성하고, 불완전한 신체 모델 초기화에 대해 견고하게 일반화되며, 모든 세부 수준에서 실시간으로 렌더링됩니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기