Arbor: 제어 가능한 3D 에셋 생성을 위한 명시적 기하학적 조건화 (Explicit Geometric Conditioning)
요약
Arbor는 텍스트 및 이미지 기반 3D 생성 시 공간적 제어를 가능하게 하는 새로운 연구입니다. 제약 메쉬(constraint meshes)를 통해 객체가 존재해야 할 영역, 피해야 할 영역, 접촉해야 할 영역을 명시적으로 지정할 수 있습니다.
핵심 포인트
- 제약 메쉬를 통한 명시적 기하학적 제어 인터페이스 도입
- Hull, Avoidance, Touch 영역을 통한 정밀한 공간 제어 가능
- 동결된 디노이저 내 학습 가능한 부착물(routed attachment) 활용
- 추가적인 준수 손실(compliance losses) 없이도 높은 제약 준수 능력 확보
텍스트 및 이미지 조건부 3D 모델은 이제 설득력 있는 에셋을 생성하지만, 객체가 차지해야 하거나 피해야 할 공간에 대해 여전히 직접적인 제어력을 거의 제공하지 못합니다. 저작 과정에서 이러한 공간적 의도는 생성이 시작되기 전에 이미 알려져 있는 경우가 많습니다. 의자는 좌석 영역 (seating envelope)에 맞아야 하고, 소품은 움직임을 위한 여유 공간을 남겨두어야 하며, 부품은 접촉면을 노출해야 합니다. 프롬프트와 이미지 뷰는 이러한 제약 조건을 전달하기에 부적절하므로, 명시적인 제어 인터페이스 (explicit control interface)가 필요합니다. 우리는 텍스트 조건부 잠재 3D 생성 (latent 3D generation)을 위한 학습 가능한 부착물인 Arbor를 제시합니다. Arbor는 제약 메쉬 (constraint meshes)를 네이티브 3D 제어 인터페이스로 도입합니다. 이 인터페이스는 기하학적 구조가 존재해야 하는 헐 영역 (hull regions), 비어 있어야 하는 회피 영역 (avoidance regions), 그리고 객체가 접촉해야 하는 터치 영역 (touch regions)을 사용합니다. 완성 (completion) 또는 전체 객체 스캐폴드 제어 (whole object scaffold control)와 달리, 이러한 메쉬는 목표 증거 (target evidence)가 아닙니다. 이것들은 국소적인 유형화된 요구 사항 (local typed requirements)이며, 표면이 나타나지 않아야 하는 영역을 포함할 수 있습니다. Arbor는 제약 메쉬를 토큰 (tokens)으로 변환하고 동결된 디노이저 (frozen denoiser) 내부에서 라우팅된 부착물 (routed attachment)을 학습함으로써 이 신호를 기하학적 구조로 유지합니다. 따라서 각 잠재 영역 (latent region)은 자신의 공간적 위치에 중요한 제약 조건의 일부를 수신할 수 있습니다. 우리는 헐, 회피, 터치 제약 조건이 포함된 자동 및 아티스트 큐레이션 제어 벤치마크에서 Arbor를 평가하며, 사용자 선호도 조사와 메트릭 추세를 비교합니다. 전용 준수 손실 (compliance losses) 없이도, Arbor는 고정된 제약 조건 하에서 객체의 품질과 다양성을 유지하면서 제약 조건 준수 능력을 향상시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기