본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 18. 21:12

저조도 군중 계수를 위한 멀티모달 하이퍼그래프 융합 (Multi-Modal Hyper-Graph Fusion for Low-Light

요약

저조도 환경에서의 군중 계수 문제를 해결하기 위해 멀티모달 하이퍼그래프 융합 기술을 제안합니다. RGB, 깊이, 엣지 정보를 하이퍼그래프로 통합하고 DRSA 모듈을 통해 계산 효율성을 높인 LCNet을 통해 SOTA 성능을 달성했습니다.

핵심 포인트

  • 저조도 환경을 위한 3종의 새로운 벤치마크 데이터셋 구축
  • RGB, 깊이, 엣지 정보를 활용한 멀티모달 하이퍼그래프 융합 모듈 제안
  • DRSA 모듈을 통한 정보 밀집 영역의 적응적 계산 할당
  • 기존 SOTA 모델 대비 저조도 군중 계수 성능 우위 입증

군중 계수 (Crowd counting)는 컴퓨터 비전 (Computer vision)의 근본적인 과제입니다. 그러나 저조도 환경에서의 군중 계수는 현실 세계에서의 실질적인 중요성에도 불구하고 여전히 충분히 연구되지 않은 상태로 남아 있습니다. 기존 방법들은 주로 조명이 밝은 장면(well-lit scenes)에 집중하거나 단일 모달리티인 RGB (Red-Green-Blue) 표현에 의존하는데, 이는 극심한 어둠과 복잡한 비균일 조명 아래에서 종종 신뢰할 수 없게 됩니다. 이 문제를 해결하기 위해, 우리는 두 개의 합성 데이터셋인 SHA_Dark와 SHB_Dark, 그리고 실제 환경 벤치마크인 LC-Crowd (Low-light Crowd Dataset)로 구성된 세 가지 새로운 저조도 군중 계수 벤치마크를 구축합니다. Retinex 기반 물리 모델링에서 영감을 받아, 우리는 저조도 조건에서 고유 반사율 (intrinsic reflectance) 표현을 강화하기 위해 깊이 (depth) 및 Canny 엣지 (Canny edge) 단서를 상호 보완적인 기하학적 및 구조적 사전 정보 (priors)로 도입합니다. 우리는 RGB 외형 (appearance), 깊이 기하학 (depth geometry), 그리고 엣지 구조 (edge structure) 단서를 통합된 하이퍼그래프 (hyper-graph) 내의 노드로 공식화하고, 동적 하이퍼엣지 (hyperedge) 구축 및 메시지 전달 (message passing)을 통해 이들의 고차원적 상호 보완 관계를 명시적으로 포착하는 멀티모달 하이퍼그래프 융합 (Multi-Modal Hyper-Graph Fusion) 모듈을 제안합니다. 나아가, 밀집 예측 (dense prediction)에서 계산을 적응적으로 할당하기 위해, 앵커 인식 추정 (anchor-aware estimation) 및 적응형 직사각형 윈도우 모델링 (adaptive rectangular window modeling)을 통해 정보가 풍부한 영역에 계산을 집중시키는 변형 가능한 직사각형 희소 어텐션 (Deformable Rectangular Sparse Attention, DRSA) 모듈을 제안합니다. 이러한 설계를 바탕으로, 우리는 견고한 저조도 군중 계수를 위한 통합된 저조도 계수 네트워크 (Low-Light Counting Network, LCNet)를 개발합니다. 세 가지 벤치마크에 대한 광범위한 실험을 통해, 제안된 방법이 기존의 최첨단 (SOTA, state-of-the-art) 방법들에 비해 최고의 전반적인 성능을 달성함을 입증합니다. 코드는 보충 자료에 포함되어 있습니다. 데이터셋은 논문 채택 시 공개될 예정입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0