학습된 3D Gaussian 표현을 통한 구조적 및 비구조적 볼륨의 효율적인 압축
요약
3D Gaussian 프리미티브를 활용하여 구조적 및 비구조적 볼륨 데이터를 효율적으로 압축하는 새로운 명시적 모델을 제안합니다. 기존 INR 방식과 달리 메쉬 저장 없이도 기하학적 구조를 인코딩할 수 있어 압축률과 재구성 품질을 크게 향상시켰습니다.
핵심 포인트
- 3D Gaussian을 스칼라 필드의 명시적 표현으로 재해석
- 비구조적 볼륨에서 메쉬 저장 없이 높은 압축률 달성
- CUDA 가속 파이프라인을 통한 최적화된 샘플링 구현
- 기존 INR 대비 학습 속도 및 비구조적 볼륨 성능 우수
최근 연구에 따르면 암시적 신경 표현 (Implicit Neural Representations, INRs)을 학습하여 구조적 (structured) 및 비구조적 (unstructured) 볼륨 데이터를 효과적으로 압축할 수 있으며, 이를 통해 메모리 사용량을 줄이면서 직접적인 데이터 쿼리가 가능함을 보여주었습니다. 그러나 비구조적 볼륨을 위한 기존의 INRs는 기하학적 구조 (geometry)를 인코딩하지 않기 때문에, 이후 샘플링을 위해 부분적인 메쉬 (mesh) 저장이 필요하며 이는 달성 가능한 압축률을 제한합니다. 동시에, 새로운 시점 합성 (novel view synthesis) 방법들은 3D Gaussian의 명시적 집합 (explicit collections)이 볼륨 데이터를 정확하게 시각화하는 데 사용될 수 있음을 보여주었습니다. 본 연구에서는 3D Gaussian 프리미티브 (primitives)에 기반한 볼륨 데이터 압축을 위한 명시적 모델을 소개합니다. 우리는 3D Gaussian의 집합을 스칼라 필드 (scalar field)의 명시적 표현으로 재해석하고, 교차하는 Gaussian들의 가중 합산 (weighted aggregation)을 통해 공간 위치에서의 스칼라 값을 재구성하는 샘플링 전략을 사용합니다. 우리는 구조적 및 비구조적 모델 샘플링을 위한 최적화된 CUDA 가속 파이프라인, 모델이 정확한 도메인 인코딩을 수행하도록 장려하는 손실 함수 (loss functions), 그리고 새로운 샘플링 오차 기반 밀도화 (densification) 전략을 개발했습니다. 우리의 명시적 공식화 (explicit formulation)는 도메인 기하학을 자연스럽게 인코딩하여 비구조적 볼륨에서 메쉬 저장의 필요성을 제거하고, 현저히 높은 압축 기회를 제공합니다. 기존의 INRs와 비교하여, 우리의 명시적 모델은 구조적 볼륨에서 상당한 학습 속도 향상과 함께 경쟁력 있는 재구성 품질을 달성하며, 비구조적 볼륨에서는 모든 지표에서 현저히 뛰어난 성능을 보임을 입증했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기