시계열에서의 빠르고 정확한 이상 탐지 (Fast and Accurate Anomaly Detection in Time Series)
요약
Haar 이산 웨이브릿과 t-검정을 결합한 새로운 비지도 학습 기반 시계열 이상 탐지 알고리즘을 제안합니다. 343개의 데이터셋 실험을 통해 기존 SOTA 비지도 및 자기지도 학습 모델보다 뛰어난 성능을 입증했습니다.
핵심 포인트
- Haar 이산 웨이브릿과 t-검정을 활용한 새로운 알고리즘 제안
- 레이블링 비용 문제를 해결하기 위한 비지도 학습 방식 채택
- 343개 데이터셋 실험을 통해 기존 SOTA 모델 대비 우수성 입증
- 클래스 불균형 및 높은 오탐률 문제를 완화하는 데 집중
이상 탐지 (Anomaly detection)는 머신러닝 (Machine Learning) 분야에서 매우 중요하고 진화하고 있는 영역으로, 사이버 보안, 금융, 의료, 제조 및 IoT (Internet of Things) 시스템과 같은 다양한 도메인을 대상으로 응용됩니다. 전통적으로 이상 탐지 알고리즘은 지도 학습 (supervised learning) 및 비지도 학습 (unsupervised learning) 패러다임을 모두 사용하여 설계되어 왔습니다. 실제 이상 탐지 시나리오에서의 근본적인 과제는 내재된 클래스 불균형 (class imbalance, 이상치는 일반적으로 드묾)과 관련이 있으며, 지도 학습 방식의 경우 레이블이 지정된 이상 데이터의 희소성과 관련이 있습니다. 실제로 레이블링 (labelling)은 비용이 많이 들고 시간이 오래 걸리는 작업입니다. 반대로 비지도 학습 방식은 레이블링이 필요하지 않지만, 안전이 중요한 (safety-critical) 애플리케이션에 배포될 때 높은 오탐률 (false positive rates)로 인해 어려움을 겪을 수 있습니다. 본 연구에서는 Haar 이산 웨이브릿 (Haar discrete wavelet)과 적절하게 설계된 $t$-검정 ($t$-test)에 기반한 시계열 이상 탐지를 위한 새로운 비지도 학습 알고리즘을 소개합니다. 우리는 제안된 $t$-검정의 이론적 토대를 구축하였으며, 343개의 데이터셋에 걸친 광범위한 실험을 통해 우리의 알고리즘이 최첨단 (state-of-the-art) 비지도 학습 및 자기지도 학습 (self-supervised) 벤치마크보다 뛰어난 성능을 보임을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기