ClothTransformer: 확장 가능한 의류 시뮬레이션을 위한 통합 잠재 공간 트랜스포머 (Unified Latent-Space
요약
ClothTransformer는 의류 시뮬레이션을 학습된 잠재 공간에서의 자기회귀 시퀀스 모델링으로 재구성한 새로운 프레임워크입니다. 다양한 시나리오를 단일 모델로 처리하며, 메쉬 해상도에 독립적인 확장 가능한 구조를 제안합니다.
핵심 포인트
- 신체 구동, 로봇 조작, 자유 낙하 등 다양한 시나리오 통합 처리
- 기존 SOTA 대비 4~9배 낮은 오차 달성
- 메쉬 해상도와 독립적인 확장 가능한 잠재 공간 공식화
- CCD 모듈을 통한 관통 아티팩트 억제 및 고충실도 데이터셋 활용
통합되고 확장 가능한 트랜스포머 (Transformers)는 최근 3D 시각 효과 (visual effects), 렌더링 프로세스 (rendering processes), 비디오 내 동작 (motion in videos)과 같이 전통적으로 컴퓨터 그래픽스 (computer graphics)와 연관된 다양한 현상을 모델링하는 데 있어 놀라운 성공을 거두었습니다. 본 연구에서는 현대적인 트랜스포머 (Transformer) 기술이 도전적인 과제인 의류 시뮬레이션 (cloth simulation)을 해결할 수 있는지 조사함으로써 한 단계 더 나아갑니다. 이를 위해 우리는 의류 시뮬레이션을 학습된 잠재 공간 (latent space)에서의 자기회귀 시퀀스 모델링 (autoregressive sequence modeling)으로 재구성하는 프레임워크인 ClothTransformer를 제시합니다. 기존의 신경망 의류 시뮬레이터 (neural cloth simulators)는 대부분 단일 시나리오에 특화되어 있고, 본질적으로 메쉬 이산화 (mesh discretization)에 결합되어 있으며, 견고한 충돌 처리 (collision handling) 능력이 부족합니다. 우리의 접근 방식은 세 가지 기여를 통해 이러한 한계를 해결합니다: (1) 신체 구동 의류 (body-driven garments), 로봇 조작 (robotic manipulation), 자유 낙하 충돌 (free-fall collisions) 등 다양한 시나리오를 단일 모델로 처리하며, 모든 시나리오에서 이전의 최첨단 (state-of-the-art) 방법들보다 약 $4$--$9{ imes}$ 낮은 오차를 달성하는 통합 트랜스포머 (Transformer) 아키텍처; (2) 임의의 해상도를 가진 메쉬 (meshes)를 고정된 크기의 잠재 토큰 (latent tokens) 세트로 압축하여, 시간적 역학 (temporal dynamics) 계산을 메쉬 해상도 (mesh resolution)와 독립적으로 만드는 확장 가능한 잠재 공간 공식화 (scalable latent-space formulation); (3) 세 가지 설정 모두를 아우르는 약 493.4k 프레임의 다양한 시나리오를 포함하는 고충실도 관통 없는 (high-fidelity penetration-free) 데이터셋으로, 이를 통해 미분 가능한 연속 충돌 감지 (Continuous Collision Detection, CCD) 모듈이 관통 아티팩트 (penetration artifacts)를 억제할 수 있게 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기