본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 22. 11:20

TimeGuard: 시계열 예측 (TSF)에서의 백도어 방어를 위한 채널별 풀 트레이닝 (Channel-wise Pool Training)

요약

시계열 예측(TSF) 모델의 백도어 공격 취약성을 분석하고, 이를 방어하기 위한 새로운 기법인 TimeGuard를 제안합니다. 데이터 얽힘과 작업 구성 변화 문제를 해결하기 위해 채널별 풀 트레이닝과 거리 정규화된 손실 선택 방식을 도입했습니다.

핵심 포인트

  • TSF 모델의 백도어 방어 실패 원인인 데이터 얽힘과 작업 구성 변화 분석
  • 채널별 풀 트레이닝을 통한 신호 희석 완화 및 백도어 국지화 개선
  • 거리 정규화된 손실 선택을 통한 훈련 단계의 손실 퇴화 방지
  • 기존 베이스라인 대비 강건성을 1.96배 향상시키며 깨끗한 성능 유지

시계열 예측 (Time Series Forecasting, TSF)은 많은 영역에서 중요한 역할을 수행하지만, 백도어 공격 (backdoor attacks)에 취약합니다. 그러나 데이터 얽힘 (data entanglement) 및 작업 구성 변화 (task-formulation shift) 문제로 인해 TSF에 특화된 백도어 방어 기법은 아직 충분히 연구되지 않았습니다. 이러한 공백을 메우기 위해, 우리는 TSF 생애 주기 전반에 걸쳐 13개의 대표적인 백도어 방어 기법을 체계적으로 평가하고 그 실패 모드 (failure modes)를 분석합니다. 우리의 연구 결과는 두 가지 근본적인 문제를 드러냅니다: (1) 데이터 얽힘은 채널 수준의 신호 희석 (signal dilution)을 유발하여, 샘플 필터링 (sample-filtering) 및 트리거 합성 (trigger-synthesis) 방어 기법이 백도어를 국지화 (localizing)하는 데 효과적이지 않게 만듭니다; (2) 작업 구성 변화는 훈련 손실 퇴화 (training-loss degeneration)를 초래하여, 훈련 단계에서 오염된 윈도우 (poisoned windows)와 깨끗한 윈도우 (clean windows)를 구별할 수 없게 만듭니다. 이러한 발견을 바탕으로, 우리는 TimeGuard라고 명명된 TSF를 위한 훈련 시간 백도어 방어 기법을 제안합니다. 우리의 방법은 채널별 풀 트레이닝 (channel-wise pool training)을 핵심 패러다임으로 채택하며, 신호 희석을 완화하기 위해 시간 인지 기준 (time-aware criteria)을 사용하여 높은 신뢰도의 풀 (high-confidence pool)을 초기화합니다. 또한, 훈련 중에 신뢰할 수 있는 풀을 점진적으로 확장하고 손실 퇴화를 완화하기 위해 거리 정규화된 손실 선택 (distance-regularized loss selection)을 도입합니다. 여러 데이터셋, 예측 아키텍처 (forecasting architectures) 및 TSF 백도어 공격에 대한 광범위한 실험을 통해, TimeGuard가 강건성 (robustness)을 실질적으로 향상시켜 기존 선도적인 베이스라인 대비 $\mathrm{MAE}\mathrm{P}$를 $1.96\times$ 높이는 동시에, 깨끗한 성능을 $\mathrm{MAE}\mathrm{C}$ 기준 5% 이내로 유지함을 입증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0