시계열 분포 외 탐지(OOD Detection)를 위한 초구면 시간-주파수 표현 학습
요약
시계열 데이터의 분포 외(OOD) 탐지를 위해 초구면 임베딩과 vMF 우도를 활용한 새로운 표현 학습 방법을 제안합니다. 시간 및 주파수 도메인을 결합한 공동 임베딩 공간을 통해 k-NN 및 마할라노비스 점수 기반의 탐지 성능을 대폭 향상시켰습니다.
핵심 포인트
- 초구면 임베딩을 통한 시계열 OOD 탐지 정식화
- vMF 우도 기반의 클래스 조건부 구조 유도
- 시간 및 주파수 도메인 관점의 통합 임베딩
- UCR/UEA 아카이브 대규모 평가를 통한 성능 입증
시계열 데이터에 대한 분포 외 (Out-of-distribution, OOD) 탐지는 비전(Vision) 및 언어(Language) 분야에 비해 상대적으로 연구가 미진한 상태이며, 분포 변화(Distributional shifts) 상황에서 지도 학습된 시계열 표현(Supervised time-series representations)을 어떻게 신뢰할 수 있는 탐지에 활용할 수 있는지에 대한 원칙적인 이해도 제한적입니다. 본 연구는 시계열 OOD 탐지를 초구면 임베딩 (Hyperspherical embeddings)을 이용한 표현 학습 (Representation learning)으로 정식화하며, 여기서 클래스 조건부 구조 (Class-conditional structure)는 단위 구체 (Unit sphere) 상에서 von Mises-Fisher (vMF) 우도 (Likelihood) 기반의 목적 함수에 의해 유도됩니다. 학습된 표현은 도메인 특화 인코더 (Domain-specific encoders)를 통해 입력 신호의 시간 도메인 (Time-domain) 및 주파수 도메인 (Frequency-domain) 관점을 결합하여, OOD 탐지를 위한 공동 임베딩 공간 (Joint embedding space)으로 통합합니다. 탐지는 학습된 임베딩에 대한 거리 기반 점수 (Distance-based scores)를 사용하며, 여기에는 k-최근접 이웃 (k-nearest neighbors, k-NN) 및 마할라노비스 (Mahalanobis) 점수가 포함됩니다. 우리는 교차 데이터셋 프로토콜 (Cross-dataset protocol) 하에 전체 UCR 및 UEA 시계열 아카이브에서 이 접근 방식을 대규모로 평가합니다. 실험 결과, 동일한 설정에서 강력한 대조 학습 (Contrastive learning) 및 사후 처리 (Post-hoc) 베이스라인 모델들에 비해 k-NN 및 마할라노비스 점수 모두에서 일관된 성능 향상을 보여주었습니다. 코드는 https://github.com/tiiuae/hypertf-time-series-ood 에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기