arXiv논문2026. 06. 16. 12:28

테스트 시간 학습(Test-Time Training)에 대한 의사결정론적 관점: 언제, 얼마나 멀리, 그리고 어떤 방향으로 적응할 것인가

요약

테스트 시간 학습(TTT)의 불안정성을 의사결정론적 관점과 암묵적 베이지안 추론으로 분석한 연구입니다. 가우시안 프로세스 벤치마크를 통해 업데이트 단계와 서브스페이스가 예측 오차에 미치는 영향을 규명하고, 최적의 적응 전략을 위한 이론적 가이드를 제시합니다.

핵심 포인트

TTT를 커널 영역에서의 암묵적 베이지안 추론으로 해석
업데이트 방향과 프롬프트 신호 간의 정렬이 성능의 핵심
프롬프트 증거 기반 업데이트 단계 선택 시 과적합 방지 가능
베이즈 최적 업데이트 서브스페이스를 위한 스코어링 규칙 도출

테스트 시간 학습 (Test-Time Training, TTT)은 파라미터 업데이트를 통해 사전 학습된 모델을 각 프롬프트(prompt)에 적응시켜, 사전 학습에서 테스트로 이어지는 분포 변화 (distribution shifts) 상황에서의 정확도를 향상시킵니다. 그러나 TTT의 성능은 업데이트 단계 (update steps) 및 서브스페이스 (subspace)와 같은 하이퍼파라미터 (hyperparameters)에 대한 불안정성과 민감도로 인해 종종 저하됩니다. 우리는 TTT를 커널 영역 (kernel regime)에서의 암묵적 베이지안 추론 (implicit Bayesian inference)으로 취급하여, 의사결정론적 (decision-theoretic) 관점을 통해 이러한 동작을 설명합니다. 가우시안 프로세스 (Gaussian process) 벤치마크 하에서, 우리는 업데이트가 프롬프트의 신호 대 잡음비 (signal-to-noise ratio)와 스펙트럼적으로 일치하고 쿼리 관련 고유 방향 (query-relevant eigen-directions)과 정렬될 때 TTT가 예측 오차를 줄인다는 것을 보여줍니다. 이러한 관점은 다음과 같은 결과들의 토대가 됩니다: (1) 분포 변화 상황에서 고정된 업데이트 단계와 서브스페이스가 실패하는 시점을 보여줌으로써 적응형 전략 (adaptive strategies)의 필요성을 제시합니다; (2) 프롬프트 증거 (prompt evidence)를 통해 업데이트 단계를 선택하는 것이 과적합 (overfitting)에 대해 PAC-Bayes 보장을 허용함을 증명합니다; (3) 선형-가우시안 보정 모델 (linear-Gaussian correction model) 하에서의 베이즈 최적 (Bayes-optimal) 업데이트 서브스페이스를 규정하여, 트랜스포머 블록 (Transformer blocks) 및 헤드 (heads)를 선택하기 위한 스코어링 규칙 (scoring rule)을 도출합니다. 우리의 이론은 TTT의 경험적 불안정성을 설명하는 데 도움을 주며, 언제, 얼마나 멀리, 그리고 어떤 방향으로 적응해야 하는지에 대한 원칙적인 가이드를 제공하는 단계로 나아갑니다.

AI 자동 생성 콘텐츠

원문 바로가기

테스트 시간 학습(Test-Time Training)에 대한 의사결정론적 관점: 언제, 얼마나 멀리, 그리고 어떤 방향으로 적응할 것인가

요약

핵심 포인트

댓글