Polycepta: 다중 객체 추적(Multi-Object Tracking)을 위한 객체 중심 외형 추정
요약
Polycepta는 다중 객체 추적(MOT)을 위해 객체의 외형을 재귀적으로 추정하는 새로운 프레임워크를 제안합니다. 정적인 외형 기술자 대신 객체별 외형 상태를 지속적으로 업데이트하여, 미학습 클래스에서도 강건한 추적 성능을 제공합니다.
핵심 포인트
- 외형 모델링을 프레임 단위 매칭이 아닌 재귀적 추정 문제로 재정의
- 축적된 관측값을 통해 외형 표현을 점진적으로 정교화
- 학습되지 않은 클래스(unseen classes)에 대해서도 외형 추정 가능
- KITTI, Waymo 등 주요 벤치마크에서 SOTA 성능 및 ID 전환 감소 입증
- 90.57 Hz의 높은 속도로 실시간 MOT 시스템 적용 가능
다중 객체 추적 (Multi-Object Tracking, MOT)에서의 탐지 기반 추적 (tracking-by-detection) 패러다임은 일반적으로 운동 추정 (motion estimation)을 보완하기 위해 정적인 외형 기술자 (appearance descriptors)에 의존합니다. 그러나 이러한 기술자들은 프레임 독립적 (frame-independent)이어서 시각적 단서로서의 강건성 (robustness)이 제한됩니다. 이러한 기술자들은 종종 계산 집약적인 사전 학습된 백본 (pretrained backbones)으로부터 얻어지기 때문에, 실시간 MOT 시스템은 외형 단서를 완전히 포기하고 운동 예측 (motion prediction)과 기하학적 연관 (geometric association)에만 의존하는 경우가 많습니다. 본 연구에서는 외형 모델링을 프레임 단위의 매칭 작업이 아닌 재귀적 추정 (recursive estimation) 문제로 재정의하는 객체 중심 외형 상태 추정 프레임워크인 Polycepta를 소개합니다. Polycepta는 각 추적 객체에 대해 독립적인 외형 상태 (appearance state)를 구축하고 지속적으로 업데이트하여, 축적된 관측값으로부터 향후 외형 표현 (appearance representations)을 추정할 수 있도록 합니다. Polycepta는 제안된 학습 전략을 통해 외형 표현을 단순히 암기하는 것이 아니라 객체별 표현의 외형 상태 구축을 학습하도록 유도되어, 학습되지 않은 클래스 (unseen classes)에 대해서도 외형 추정이 가능합니다. Polycepta의 핵심적인 특성은 추론 (inference) 과정에서 객체 상태가 진화함에 따라 외형 추정의 품질이 향상된다는 점입니다. 기존의 외형 기술자가 정적이거나 시간이 지남에 따라 저하되는 것과 달리, Polycepta는 추가적인 관측값이 축적됨에 따라 외형 추정치를 점진적으로 정교화합니다. KITTI, Waymo Open Dataset, 그리고 MOT17에 대한 광범위한 실험을 통해, 탐지 기반 추적 (tracking-by-detection) 파이프라인에 통합되었을 때 ID 전환 (identity switches)이 일관되게 감소하고 추적 성능이 향상됨을 입증했습니다. Polycepta는 90.57 Hz로 작동하며, RobMOT 프레임워크에 통합되었을 때 KITTI 벤치마크에서 92.27%의 MOTA를 달성하며 최첨단 (state-of-the-art) 성능을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기