약지도 학습 기반 시공간 이상 탐지 (Weakly-Supervised Spatiotemporal Anomaly Detection)
요약
본 논문은 비디오 기반 이상 탐지(Anomaly Detection)를 위해 약지도 학습(Weakly Supervised) 방법을 제안합니다. 시간 소모적인 비디오 주석 대신, 영상 전체 수준의 레이블만을 활용하여 정상/이상 여부를 판단하고 특징을 추출합니다. 특히 Multiple Instance Ranking Loss (MIL)와 분류기를 결합하여 시공간 영역별 이상 점수를 결정하며, 공간적 및 시간적 이상 탐지를 모두 다룹니다.
핵심 포인트
- 비디오 주석의 어려움을 극복하기 위해 약지도 학습(Weakly Supervised) 방식을 채택했습니다.
- 영상 전체 수준의 레이블만 사용하여 정상/이상 여부를 판단하고 특징을 추출합니다.
- Multiple Instance Ranking Loss (MIL)를 활용하여 시공간 영역별 이상 점수를 결정하는 것이 핵심입니다.
- 단순한 공간적 탐지를 넘어 시간적(Temporal) 이상 징후까지 포괄적으로 다루었습니다.
본 논문에서는 이상 탐지 (Anomaly Detection)를 위한 약지도 학습 (Weakly Supervised) 방법을 탐구합니다. 비디오에 주석을 다는 작업은 시간이 많이 소요되기 때문에, 우리는 학습 과정 동안 약한 비디오 수준의 레이블 (Video-level labels)만을 고려합니다. 이는 특정 비디오가 주어졌을 때, 해당 비디오가 정상인지 또는 이상 징후를 포함하고 있는지는 알 수 있지만, 네트워크를 학습시키기 위해 추가적인 주석은 사용되지 않음을 의미합니다. 정상 또는 이상이 있는 비디오 클립으로부터 특징 (Features)을 추출합니다. 이러한 특징들은 분류기 (Classifier)와 다중 인스턴스 랭킹 손실 (Multiple Instance Ranking Loss, MIL)의 구현을 기반으로 클립의 시공간 영역 (Spatiotemporal regions)에 대한 이상 점수 (Anomaly scores)를 결정하는 데 사용됩니다. MIL을 적용하기 위해, 이상이 있는 비디오 클립과 정상 비디오 클립을 각각 양성 백 (Positive bags)과 음성 백 (Negative bags)으로 표현합니다. 또한, 이상 징후는 보통 프레임 전체보다는 프레임의 일부에 국한되어 나타나기 때문에, 우리는 공간적 (Spatial) 이상 탐지뿐만 아니라 시간적 (Temporal) 이상 탐지를 탐구하기로 했습니다. 우리는 UCF Crime 데이터셋의 일부에 대한 시공간 주석을 포함하고 있는 UCF Crime2Local 데이터셋을 통해 결과를 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기