arXiv논문2026. 06. 15. 05:04

CRAFTIIF: 다중 해상도 분석 기반 4가지 유형 해석 가능한 Isolation Forest를 이용한 다변량 시계열 이상 탐지

요약

CRAFTIIF는 다변량 시계열의 네 가지 이상 유형(점형, 분포형, 시간적, 집합적)을 모두 탐지할 수 있는 새로운 비지도 학습 프레임워크입니다. 웨이블릿 특징 추출과 구조화된 Isolation Forest를 결합하여 높은 탐지 성능과 해석 가능성을 동시에 제공합니다.

핵심 포인트

네 가지 시계열 이상 유형을 통합 탐지하는 비지도 프레임워크 제시
웨이블릿 기반 특징 추출을 통한 구조적 해석 가능성 확보
mTSBench 벤치마크 및 VUS-PR 평가에서 기존 방법론 대비 압도적 성능 기록
적응형 임계값 설정을 통해 다양한 이상률에 자동 대응 가능

다변량 시계열에서의 이상 탐지는 구조적으로 구별되는 네 가지 유형의 이상(점형(isolated spikes), 분포형(level shifts), 시간적(rhythm changes), 집합적(inter-sensor correlation breakdowns))에 의해 어려움을 겪으며, 각 유형은 서로 다른 특징 표현을 요구합니다. 대부분의 비지도 학습 방법들은 한두 가지 유형만을 목표로 하며 해석 가능성이 제한적입니다. 우리는 데이터셋별 조정 없이 네 가지 모든 유형을 겨냥하는 완전한 비지도 프레임워크인 CRAFTIIF (Cross-Resolution Analytic Four-Type Interpretable Isolation Forest)를 제시합니다. CRAFTIIF는 네 가지 계열(Morlet, DOG, Haar, Coiflet)에 걸쳐 K=500개의 무작위 분석 웨이블릿 특징 추출을 생성하며, 각 특징은 특정 이상 유형을 겨냥하고 다섯 개의 구조화된 Isolation Forest를 공급합니다 (각 유형별 하나와 복합 이상을 위한 메타-IF). 적응형 Otsu/MAD 임계값은 0.1%에서 69.2%까지의 이상률에 걸쳐 탐지를 자동으로 보정합니다. 각 IF가 오직 유형별 특징으로만 학습되기 때문에, 분기 발화(branch firing)는 사후 설명 없이 구조적으로 직접적인 이상 유형 기여도를 제공합니다. mTSBench 벤치마크의 모든 19개 데이터셋(Zhou et al., TMLR 2026)에서 평가된 CRAFTIIF는 평균 F1=0.228 (모든 19개 데이터셋) 및 F1=0.322 (탐지 가능한 13개 데이터셋)을 달성하며, VUS-PR에서 평가된 모든 25개 방법 중 최고 순위(0.463 대 이전 최고치 0.329, +40.7%)를 기록했습니다. 진단 프레임워크—오라클 F1, 탐지 한계, 분기 분리 비율—는 19개 데이터셋 중 6개를 어떤 비지도 방법으로도 근본적으로 탐지할 수 없음을 식별합니다. 11가지 조건에 대한 제거 연구(Ablation)를 통해 적응형 임계값 설정(+38% F1), 네 가지 분기 구조(+20%), 그리고 메타-IF(+23%)가 각각 필수적임을 확인했습니다. 코드: https://github.com/smitswil/craftiif

AI 자동 생성 콘텐츠

원문 바로가기

CRAFTIIF: 다중 해상도 분석 기반 4가지 유형 해석 가능한 Isolation Forest를 이용한 다변량 시계열 이상 탐지

요약

핵심 포인트

댓글