arXiv논문2026. 06. 30. 12:22

백본이 아닌 헤드: 팻테일 수익률(Fat-Tailed Returns) 구조에서 출력 헤드의 지배력

요약

금융 수익률의 팻테일(fat-tail) 구조를 예측할 때 백본 아키텍처보다 출력 헤드의 설계가 더 중요하다는 연구 결과입니다. 가우시안 혼합 밀도 헤드를 사용하면 단일 가우시안 대비 테일 리스크 포착 능력이 향상되어 예측 성능이 개선됩니다.

핵심 포인트

단기 시계열 예측에서는 백본보다 출력 헤드의 설계가 성능에 더 큰 영향을 미침
가우시안 혼합 밀도 헤드가 단일 가우시안보다 테일 리스크 포착에 효과적임
스태그플레이션 등 변동성이 높은 위기 구간에서 혼합 모델의 가치가 극대화됨
장기 시계열 예측(h >= 6)으로 갈수록 백본 아키텍처의 영향력이 다시 커짐

단기 시계열의 팻테일(fat-tailed) 금융 수익률을 위한 딥러닝 예측 파이프라인에서, 백본(backbone) 아키텍처와 출력 헤드(output head) 중 무엇이 더 중요할까요? 우리는 세 가지 출력 헤드—포인트 헤드(point head), 단일 가우시안 밀도 헤드(single-Gaussian density head), 그리고 K=4개의 성분을 가진 가우시안 혼합 밀도 헤드(Gaussian mixture density head)—하에서 네 가지 현대적 백본(TimesNet, DLinear, N-BEATS, iTransformer)을 비교합니다. 앵커드 워크포워드 검증(anchored walk-forward validation)을 적용한 S&P 500 월간 로그 수익률(1871-2023) 데이터셋에서, 세 가지 헤드는 엄격한 기울기(gradient)를 형성합니다. 포인트 헤드에서 가우시안으로 전환하면 CRPS가 약 1.3% 개선되며, 가우시안에서 혼합(mixture) 모델로 전환하면 약 2.4%가 추가로 개선됩니다. 반면, 백본 간의 전환은 포인트 헤드 행과 백본 평균 축에서 CRPS를 1.5% 미만으로 변화시킵니다. 밀도 헤드(density-head)의 백본 확산(spread)은 더 크지만(h=1 가우시안 행에서 N-BEATS에 의해 최대 5.1%까지 발생), 헤드 기울기(3.7 퍼센트 포인트)가 여전히 지배적입니다. 제곱 오차(squared errors)에 대한 모델 신뢰 집합(Model Confidence Set)은 5% 유의 수준에서 12가지 변형 모델 중 어느 것도 배제하지 않았습니다. 즉, 헤드는 제곱 오차가 아닌 분포 지표(CRPS, pinball, coverage)에서만 모델들을 구분합니다. 단일 가우시안 대비 혼합 헤드의 증분 가치는 변동성이 가장 높은 구간(h=12에서 1970년대 스태그플레이션 시기 13.9%)에서 가장 컸으며, 이는 혼합 모델이 단봉형(unimodal) 가우시안이 표현할 수 있는 범위를 넘어 테일 리스크(tail risk)를 포착함을 확인시켜 줍니다. 이러한 양상은 예측 시계열(horizon)에 따라 달라집니다. 단기 시계열에서는 헤드가 지배적이지만, 장기 시계열(h >= 6)에서는 백본이 다시 주도권을 잡습니다. 우리는 이러한 h-분할(h-split) 현상을 고전적 베이스라인과 비교하여 기록하였습니다(섹션 5.1). 결론적으로, 단기 팻테일 수익률에서는 헤드가 백본보다 지배적이며, 혼합 분포는 리스크 관리 결정이 실제로 중요한 위기 기간 동안 단일 가우시안보다 실질적인 가치를 더해줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

백본이 아닌 헤드: 팻테일 수익률(Fat-Tailed Returns) 구조에서 출력 헤드의 지배력

요약

핵심 포인트

댓글