
GARD: 기하학 인지 표현 디노이징 (Geometry-Aware Representation Denoising)
요약
GARD는 3D 재구성 모델의 특징 공간에서 직접 수행되는 확산 기반 복원 기술입니다. 교차 뷰 기하학을 보존하며 손상된 입력으로부터 이미지와 3D 구조를 효과적으로 복구합니다.
핵심 포인트
- 특징 공간 내 확산 기반 복원 방식 채택
- 교차 뷰 기하학 보존을 통한 3D 구조 복구
- 픽셀 공간 및 VAE 방식 대비 우수한 성능
- SpatialBench를 통한 공간 기초 모델 평가
GARD: 기하학 인지 표현 디노이징 (Geometry-Aware Representation Denoising)
3D 재구성 (3D reconstruction) 모델의 특징 공간 (feature space) 내부에서 직접 수행되는 확산 기반 (Diffusion-based) 복원.
손상된 입력으로부터 깨끗한 이미지와 3D 구조를 복구하는 동안 교차 뷰 기하학 (cross-view geometry)을 보존합니다.
픽셀 공간 (pixel-space) 및 VAE 기반 방식보다 뛰어난 성능을 보입니다.
프로젝트 페이지:
https://cvlab-kaist.github.io/GARD/
논문:
https://huggingface.co/papers/2605.26
230
…
SpatialBench
공간 기초 모델 (spatial foundation models)을 위한 최초의 교차 패러다임 벤치마크로, 19개의 데이터셋, 546개의 장면, 41개의 모델을 아우르며 단 하나의 질문에 답합니다: 당신은 진정으로 다재다능한 플레이어인가?
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기