MoEIoU: 전문가 혼합 (Mixture of Experts) 방식을 통한 경계 상자 회귀 (Bounding-Box Regression)의
요약
객체 탐지의 정밀도를 높이기 위해 MoE(Mixture-of-Experts) 방식을 적용한 새로운 경계 상자 회귀 손실 함수인 MoEIoU를 제안합니다. 학습 단계에 따라 위치, 형태, 중첩 오류를 적응적으로 조절하여 기존 IoU 기반 손실 함수보다 빠른 수렴과 높은 정확도를 달성했습니다.
핵심 포인트
- MoE 방식을 통한 중첩, 중심 정렬, 종횡비 불일치의 공동 모델링
- 학습 단계별 최적화를 위한 커리큘럼 기반 가중치 스케줄링 도입
- log-sum-exp 함수를 활용한 지배적 위치 추정 오류 강조
- MS COCO 등 주요 데이터셋에서 SOTA 성능 및 빠른 수렴 입증
경계 상자 회귀 (Bounding-box regression)는 객체 탐지 (Object detection)의 핵심 구성 요소로, 정밀한 객체 위치 추정 (Localization)에서 결정적인 역할을 합니다. 기존의 IoU (Intersection-over-Union) 기반 손실 함수 (Loss functions)는 경계 상자 회귀를 개선하기 위해 중심 거리 (Center-distance) 및 종횡비 불일치 (Aspect-ratio mismatch)와 같은 기하학적 패널티 (Geometric penalties)를 통합하여 IoU 목적 함수를 확장해 왔습니다. 그러나 이러한 패널티들은 일반적으로 학습 과정 내내 고정된 상태로 유지되며, 예측된 상자들이 초기에는 큰 중심 거리와 형태 오류를 보이다가 후기 단계에서는 정답 (Ground truth)과의 중첩 (Overlap)을 개선하는 데 집중하는 최적화 역학 (Optimization dynamics)을 고려하지 못합니다. 이러한 한계를 해결하기 위해, 우리는 중첩 (Overlap), 중심 정렬 (Center alignment), 그리고 종횡비 불일치 (Aspect-ratio mismatch)를 공동으로 모델링하는 전문가 혼합 (Mixture-of-experts) 기반 회귀 손실인 MoEIoU를 소개합니다. MoEIoU는 log-sum-exp 함수를 사용하여 이러한 구성 요소들을 집계하며, 이는 다른 항들의 부드러운 기여를 유지하면서도 지배적인 위치 추정 오류 (Localization error)를 강조합니다. 또한, 학습 초기 단계에서는 상자의 위치와 형태를 수정하는 것을 우선시하고, 후기 단계에서는 중첩을 개선하는 데 집중하도록 커리큘럼 기반 가중치 스케줄 (Curriculum-based weighting schedule)을 채택합니다. 우리는 다양한 YOLO 아키텍처와 대규모 시뮬레이션 실험을 통해 PASCAL VOC, HRIPCB, MS COCO 데이터셋에서 제안된 MoEIoU를 평가했습니다. MoEIoU는 표준 및 최신 최첨단 (State-of-the-art) 손실 함수들을 지속적으로 능가하며, 더 빠른 수렴 (Convergence)과 향상된 위치 추정 정확도를 보여주었습니다. 나아가, 우리는 이러한 적응형 집계 (Adaptive aggregation)가 기존의 IoU 기반 손실 함수들을 개선하여 일관된 이득을 창출하고, 객체 탐지 프레임워크 내의 경계 상자 회귀를 위한 더욱 효과적인 최적화 가이드를 제공함을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기