무작위 합성곱 특징 (Random Convolutional Features) 매칭을 통한 금융 시계열 생성
요약
금융 시계열 생성 시 발생하는 과적합 문제를 해결하기 위해 무작위 합성곱 특징(RCF) 매칭 방식을 제안합니다. 미분 가능한 SOCK(SOft Competing Kernels)를 도입하여 기존 시그니처 기반 모델보다 뛰어난 생성 성능을 입증했습니다.
핵심 포인트
- 금융 시계열의 희소 데이터 및 과적합 문제 해결
- 미분 가능한 무작위 합성곱 특징 맵인 SOCK 제안
- 기존 시그니처 및 확산 베이스라인 모델 능가
- 시계열 분류 및 가설 검정에서 높은 표현력 입증
현실적인 금융 시계열 (Financial Time Series)을 생성하는 것은 학습 데이터가 종종 단일한 역사적 경로 (Historical Path)로 제한되기 때문에 매우 어렵습니다. 이처럼 희소한 데이터 환경에서는 과적합 (Overfitting)을 피하기 어려우며, 특히 학습된 판별기 (Discriminator)가 학습 샘플을 암기할 수 있는 적대적 학습 (Adversarial Training) 상황에서는 더욱 그러합니다. 이를 완화하기 위해, 최근의 접근 방식들은 실제 시계열과 생성된 시계열의 학습되지 않은 특징 표현 (Feature Representations) 사이의 불일치를 최소화하도록 생성기 (Generator)를 학습시킵니다. 이러한 연구들에서 특징 맵 (Feature Maps)은 경로 시그니처 (Path Signatures)를 기반으로 하는데, 이는 다룰 수 있는 절단 깊이 (Truncation Depths) 내에서 관련 시계열 특성을 포착하는 데 실패할 수 있습니다. 본 연구에서는 대신 실제 시계열과 생성된 시계열의 무작위 합성곱 특징 (Random Convolutional Features)을 매칭함으로써 생성기를 학습시킵니다. Rocket 및 Hydra와 같은 기존의 무작위 합성곱 특징 맵은 실제 세계의 시계열에 대해 유익한 표현을 제공하는 것으로 입증되었으나, 미분 불가능 (Non-differentiable)하기 때문에 생성 모델을 감독할 수 없습니다. 우리는 생성 시계열 모델을 학습시키기에 적합한, 완전 미분 가능한 무작위 합성곱 특징 맵인 SOCK (SOft Competing Kernels)를 소개합니다. 우리는 무작위 SOCK 특징을 매칭하여 학습된 생성기가 광범위한 소규모 샘플 금융 데이터셋 전반에서 시그니처 (Signature) 및 확산 (Diffusion) 베이스라인 모델들을 일관되게 능가함을 보여줍니다. 나아가 우리는 두 샘플 가설 검정 (Two-sample Hypothesis Testing) 및 시계열 분류 (Time Series Classification) 작업에서 SOCK의 표현력 (Expressiveness)을 입증하며, 여기서 SOCK는 기존의 비지도 특징 맵 (Unsupervised Feature Maps)과 대등하거나 이를 능가하는 성능을 보입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기