GAP-GDRNet: 단일 대상 합성 우주선 데이터셋에서의 기하학 인지 단안 시각 포즈 센싱
요약
우주선의 약한 질감과 조명 변화 문제를 해결하기 위해 기하학 인지 어텐션이 강화된 GAP-GDRNet 프레임워크를 제안합니다. AFR과 PGSA 모듈을 통해 단안 RGB 이미지 기반의 정밀한 6D 포즈 센싱을 구현합니다.
핵심 포인트
- 비협력적 랑데부 및 궤도 서비스용 6D 포즈 센싱 연구
- AFR 모듈을 통한 전역적 우주선 구조 및 국소적 특징 강화
- PGSA 모듈을 활용한 패치 레벨 기하학적 셀프 어텐션 적용
- Blender 기반의 합성 데이터셋을 통한 지도 학습 수행
단안 상대 포즈 센싱 (Monocular relative pose sensing)은 비협력적 랑데부 (non-cooperative rendezvous) 및 궤도 상 서비스 (on-orbit servicing)에서 핵심적인 인지 문제이다. 그러나 우주선 이미지에서는 약한 표면 질감, 얇은 부속품, 조명 변화, 그리고 부분적인 폐쇄 (occlusion)로 인해 종종 희소하고 불안정한 기하학적 증거만이 남게 된다. 본 논문은 단안 RGB 기반 6D 포즈 센싱을 위한 기하학 인지 어텐션 강화 프레임워크인 GAP-GDRNet을 제시한다. 이 방법은 GDR-Net의 기하학 가이드 직접 회귀 (geometry-guided direct regression) 패러다임을 따르며, 파이프라인에서 두 가지 지점을 수정한다: 밀집 기하학 예측 (dense geometric prediction) 이전에 어텐션 기반 특징 정제 (AFR, attention-based feature refinement) 모듈을 배치하였고, Patch-PnP에 패치 레벨 기하학적 셀프 어텐션 (PGSA, patch-level geometric self-attention) 모듈을 삽입하였다. AFR은 국소적인 약한 질감 단서와 함께 전역적인 우주선 구조를 강화하며, 이후 PGSA는 최종 포즈 회귀 (pose regression) 전에 다운샘플링된 기하학적 패치들을 연결한다. Blender 기반의 주석 (annotation) 프로세스는 지도 학습 (supervised training)을 위해 타겟 마스크, 가시 영역 마스크, 밀집 모델 좌표 맵, 카메라 내부 파라미터 (camera intrinsics), 그리고 6D 포즈 라벨을 제공한다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기