빛의 힘: 물리 기반 간접 조명을 통한 합성-실제 도메인 적응(Synthetic-to-Real Domain Adaptation) 개선
요약
합성 데이터와 실제 데이터 간의 도메인 간극을 줄이기 위해 물리 기반 셰이딩(PBS)을 활용한 연구를 소개합니다. 조명 구성과 배경 복잡도가 객체 탐지 성능에 미치는 영향을 분석하여, 산업 자동화에 최적화된 가상 장면 설계 가이드라인을 제시합니다.
핵심 포인트
- 물리 기반 셰이딩(PBS)을 통한 합성-실제 도메인 적응 개선
- SmartSDG 파이프라인 및 ILLUM_INTRUCK 데이터셋 제안
- 복잡한 간접 조명이 시각적 단서 풍부함과 모델 수렴을 가속화함
- 직접 정반사 피크를 피함으로써 표면 질감 보존 및 오탐 감소
합성 데이터 생성(Synthetic data generation)이 컴퓨터 비전 분야의 수동 레이블링 병목 현상을 해결해 주지만, 합성-실제(syn-to-real) 도메인 간극을 최소화하려면 렌더링 변수를 최적화해야 합니다. 본 논문은 조명 구성(lighting configurations)과 배경 복잡도가 객체 탐지(object detection) 성능에 미치는 영향을 분석하는 체계적인 연구를 제시합니다. 우리는 물리 기반 셰이딩 (Physically-Based Shading (PBS))을 사용하여 NVIDIA Isaac Sim 상에서 구축된 자동화되고 재현 가능한 파이프라인인 SmartSDG와, 새로운 다중 객체 산업용 벤치마크 데이터셋인 ILLUM_INTRUCK을 소개합니다. 최신 YOLOv12 프레임워크를 활용한 18가지 통제된 실험을 통해, 도메인 관련 배경 가변성(background variability)과 결합된 복잡한 간접 조명 구성이 시각적 단서(visual cue)의 풍부함을 크게 증가시킨다는 것을 입증합니다. 우리의 정량적 연구 결과에 따르면, 직접적인 정반사 피크(specular peaks)를 피하는 것이 중요한 표면 질감(surface textures)을 보존하고, 도메인 간극을 완화하며, 오탐(false positives)을 줄이고, 기존의 직접 조명 합성 데이터를 사용하는 것에 비해 모델 수렴(model convergence)을 가속화함을 보여줍니다. 궁극적으로, 우리는 산업 자동화에서 객체 탐지 강건성(robustness)을 극대화하기 위한 실행 가능한 가상 장면 설계 가이드라인을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기