본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 28. 06:03

GARD: 기하학 인지 표현 디노이징 (Geometry-Aware Representation Denoising)

요약

GARD는 3D 재구성 모델의 특징 공간에서 직접 수행되는 확산 기반 복원 기술입니다. 교차 뷰 기하학을 보존하며 손상된 입력으로부터 이미지와 3D 구조를 효과적으로 복구합니다.

핵심 포인트

  • 특징 공간 내 확산 기반 복원 방식 채택
  • 교차 뷰 기하학 보존을 통한 3D 구조 복구
  • 픽셀 공간 및 VAE 방식 대비 우수한 성능
  • SpatialBench를 통한 공간 기초 모델 평가

GARD: 기하학 인지 표현 디노이징 (Geometry-Aware Representation Denoising)

3D 재구성 (3D reconstruction) 모델의 특징 공간 (feature space) 내부에서 직접 수행되는 확산 기반 (Diffusion-based) 복원.

손상된 입력으로부터 깨끗한 이미지와 3D 구조를 복구하는 동안 교차 뷰 기하학 (cross-view geometry)을 보존합니다.

픽셀 공간 (pixel-space) 및 VAE 기반 방식보다 뛰어난 성능을 보입니다.

프로젝트 페이지:
https://cvlab-kaist.github.io/GARD/
논문:
https://huggingface.co/papers/2605.26
230

SpatialBench

공간 기초 모델 (spatial foundation models)을 위한 최초의 교차 패러다임 벤치마크로, 19개의 데이터셋, 546개의 장면, 41개의 모델을 아우르며 단 하나의 질문에 답합니다: 당신은 진정으로 다재다능한 플레이어인가?

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0