SCAN: 다중 스케일 이웃 중심 클러스터링을 통한 시계열 이상 탐지 강화
요약
시계열 이상 탐지에서 발생하는 과잉 및 과소 일반화 문제를 해결하기 위해 다중 스케일 클러스터링을 도입한 SCAN 모델을 제안합니다. 클러스터 중심 표현과 이상 신뢰도 점수를 결합하여 탐지 성능을 강화하고, 이웃 중심 표현을 통해 클러스터링 정확도를 높였습니다.
핵심 포인트
- 재구성 기반 방식의 일반화 문제를 다중 스케일 클러스터링으로 해결
- 클러스터 중심 표현을 통한 정상 패턴 재구성 제약
- 클러스터 멤버십 확률 기반의 이중 이상 판정 기준 도입
- 다중 뷰 클러스터링을 위한 이웃 중심 표현 추출 기술 적용
- 다양한 실제 데이터셋에서 SOTA 성능 입증
시계열 이상 탐지 (Time series anomaly detection)는 광범위한 실제 응용 분야에서 중요한 역할을 합니다. 재구성 기반 방식 (Reconstruction-based methods)이 주류 패러다임이 되었으나, 이들은 균형을 맞추기 어려운 과잉 일반화 (over-generalization) 및 과소 일반화 (under-generalization) 문제로 어려움을 겪고 있습니다. 이를 해결하기 위해, 우리는 재구성 기반 방식을 강화하기 위한 다중 스케일 클러스터링 (multi-scale clustering)을 도입합니다. 표현 (representation) 수준에서는, 정상 패턴의 클러스터 중심 표현 (cluster center representations)을 통합하여 모델이 재구성을 위해 대표적인 정상 패턴을 목표로 하도록 제약함으로써, 강력한 용량과 표현 능력의 지배 현상을 방지합니다. 이상 판정 기준 (anomaly criterion) 수준에서는, 클러스터 멤버십 확률 (cluster membership probability)을 기반으로 이상 신뢰도 점수 (anomaly confidence score)를 도출하고 이를 재구성 오차 (reconstruction error)와 결합하여 탐지를 위한 이중 기준을 제공합니다. 나아가, 클러스터 중심 표현과 이상 신뢰도 점수의 효과는 클러스터링 성능에 달려 있습니다. 이에 따라, 우리는 클러스터링 성능을 향상시키기 위해 다중 뷰 클러스터링 (multi-view clustering)을 위한 이웃 중심 표현 (neighborhood-centered representations)을 추출합니다. 다양한 응용 분야의 여러 실제 데이터셋에 대한 광범위한 실험을 통해 SCAN의 최첨단 (state-of-the-art) 성능을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기