arXiv논문2026. 05. 22. 11:20

TimeGuard: 시계열 예측 (TSF)에서의 백도어 방어를 위한 채널별 풀 트레이닝 (Channel-wise Pool Training)

요약

시계열 예측(TSF) 모델의 백도어 공격 취약성을 분석하고, 이를 방어하기 위한 새로운 기법인 TimeGuard를 제안합니다. 데이터 얽힘과 작업 구성 변화 문제를 해결하기 위해 채널별 풀 트레이닝과 거리 정규화된 손실 선택 방식을 도입했습니다.

핵심 포인트

TSF 모델의 백도어 방어 실패 원인인 데이터 얽힘과 작업 구성 변화 분석
채널별 풀 트레이닝을 통한 신호 희석 완화 및 백도어 국지화 개선
거리 정규화된 손실 선택을 통한 훈련 단계의 손실 퇴화 방지
기존 베이스라인 대비 강건성을 1.96배 향상시키며 깨끗한 성능 유지

시계열 예측 (Time Series Forecasting, TSF)은 많은 영역에서 중요한 역할을 수행하지만, 백도어 공격 (backdoor attacks)에 취약합니다. 그러나 데이터 얽힘 (data entanglement) 및 작업 구성 변화 (task-formulation shift) 문제로 인해 TSF에 특화된 백도어 방어 기법은 아직 충분히 연구되지 않았습니다. 이러한 공백을 메우기 위해, 우리는 TSF 생애 주기 전반에 걸쳐 13개의 대표적인 백도어 방어 기법을 체계적으로 평가하고 그 실패 모드 (failure modes)를 분석합니다. 우리의 연구 결과는 두 가지 근본적인 문제를 드러냅니다: (1) 데이터 얽힘은 채널 수준의 신호 희석 (signal dilution)을 유발하여, 샘플 필터링 (sample-filtering) 및 트리거 합성 (trigger-synthesis) 방어 기법이 백도어를 국지화 (localizing)하는 데 효과적이지 않게 만듭니다; (2) 작업 구성 변화는 훈련 손실 퇴화 (training-loss degeneration)를 초래하여, 훈련 단계에서 오염된 윈도우 (poisoned windows)와 깨끗한 윈도우 (clean windows)를 구별할 수 없게 만듭니다. 이러한 발견을 바탕으로, 우리는 TimeGuard라고 명명된 TSF를 위한 훈련 시간 백도어 방어 기법을 제안합니다. 우리의 방법은 채널별 풀 트레이닝 (channel-wise pool training)을 핵심 패러다임으로 채택하며, 신호 희석을 완화하기 위해 시간 인지 기준 (time-aware criteria)을 사용하여 높은 신뢰도의 풀 (high-confidence pool)을 초기화합니다. 또한, 훈련 중에 신뢰할 수 있는 풀을 점진적으로 확장하고 손실 퇴화를 완화하기 위해 거리 정규화된 손실 선택 (distance-regularized loss selection)을 도입합니다. 여러 데이터셋, 예측 아키텍처 (forecasting architectures) 및 TSF 백도어 공격에 대한 광범위한 실험을 통해, TimeGuard가 강건성 (robustness)을 실질적으로 향상시켜 기존 선도적인 베이스라인 대비 $\mathrm{MAE}\mathrm{P}$를 $1.96\times$ 높이는 동시에, 깨끗한 성능을 $\mathrm{MAE}\mathrm{C}$ 기준 5% 이내로 유지함을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

TimeGuard: 시계열 예측 (TSF)에서의 백도어 방어를 위한 채널별 풀 트레이닝 (Channel-wise Pool Training)

요약

핵심 포인트

댓글