다중 뷰 레이더 의미론적 분할을 위한 구조적 일관성을 갖춘 표현 학습
요약
레이더 센서의 희소성과 노이즈 문제를 해결하기 위해 하이퍼그래프와 불균형 최적 운송(UOT)을 활용한 다중 뷰 레이더 의미론적 분할 프레임워크를 제안합니다. 이 방법은 다양한 레이더 뷰 간의 고차 의존성을 포착하고 구조적 일관성을 보장하여 정밀한 인지를 가능하게 합니다.
핵심 포인트
- 하이퍼그래프를 통한 레이더 특징의 고차 의존성 포착
- 불균형 최적 운송(UOT)을 이용한 뷰별 특징 정렬
- RA, RD, AD 뷰 간의 구조적 일관성 확보
- CARRADA 및 RADIal 벤치마크에서 기존 SOTA 대비 성능 향상
레이더 센서는 악천후 및 조명 조건에서도 신뢰할 수 있는 인지 능력을 제공하지만, 희소하고(sparse) 노이즈가 많으며 의미론적 정보가 약한 측정값으로 인해 밀집된 의미론적 분할(dense semantic segmentation)을 수행하는 데 어려움이 있습니다. 기존의 대부분의 레이더 분할 방법은 그리드 기반 인코딩(grid-based encodings)과 쌍별 상호작용(pairwise interactions)에 의존하며, 이는 동일한 물리적 객체로부터 발생하는 다중 레이더 반사(multiple radar returns)에 의해 형성되는 고차 관계 구조(higher-order relational structure)를 포착하는 데 어려움을 겪습니다. 우리는 다중 뷰 레이더 분할을 위한 통합된 고차 구조 정렬 프레임워크를 소개합니다. 제안된 방법은 학습 가능한 하이퍼그래프(hypergraphs)를 사용하여 레이더 특징 표현(feature representations)을 정제함으로써 공간적으로 관련된 응답들 사이의 고차 의존성(higher-order dependencies)을 포착합니다. 이질적인 레이더 투영(radar projections) 간의 일관성을 보장하기 위해, 우리는 불균형 최적 운송(Unbalanced Optimal Transport, UOT)을 사용하여 뷰별 특징(view-specific features)을 추가로 정렬하며, 이를 통해 다양한 측정 밀도와 부분적 관측 하에서도 대응 관계가 필요 없는(correspondence-free) 정렬을 가능하게 합니다. 그런 다음 적응형 어텐션 메커니즘(adaptive attention mechanism)이 상호 보완적인 레이더 뷰를 융합하는 동시에, 희소성과 노이즈 상황에서 구조적으로 유익한 응답을 강조합니다. 결과적으로 도출된 아키텍처는 거리-각도(Range Angle, RA), 거리-도플러(Range Doppler, RD), 각도-도플러(Angle Doppler, AD) 뷰 전반에 걸쳐 구조적으로 일관된 표현을 학습하며, 지도 학습 기반 분할(supervised segmentation)과 교차 뷰 일관성 정규화(cross-view consistency regularisation)를 함께 사용하여 훈련됩니다. CARRADA 및 RADIal 벤치마크에서의 실험 결과, 강력한 레이더 특화 베이스라인(baselines) 대비 일관된 성능 향상을 입증하였으며, CARRADA에서 63.8% mIoU, RADIal에서 83.4% mIoU를 달성하여 이전의 최고 방법들보다 각각 +1.7 및 +2.3 mIoU를 개선했습니다. 이러한 결과는 견고한 레이더 인지를 위한 고차 관계 모델링(higher-order relational modelling)의 중요성을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기