본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 18. 11:42

매끄러운 손실 함수를 위한 PAC-Bayes 경계의 매끄러움 기반 비무작위화 (Smoothness-Based Derandomization of

요약

매끄러운 손실 함수를 대상으로 PAC-Bayes 비무작위화 연구를 통해 결정론적 예측기의 일반화 경계를 도출합니다. Jacobian과 Hessian을 활용한 평탄도(flatness) 개념을 통해 일반화 간극을 제어하며, 이를 신경망 정규화의 이론적 근거로 제시합니다.

핵심 포인트

  • 매끄러운 손실 함수 특성을 활용한 결정론적 예측기의 일반화 경계 연구
  • Jensen gap과 Rademacher 복잡도를 통한 일반화 간극 제어
  • Jacobian 및 Hessian을 이용한 평탄도(flatness) 기반의 경계 도출
  • BatchNorm 네트워크를 위한 실용적인 정규화 항 모티베이션 제공

우리는 매끄러운 손실 함수 (smooth loss functions)에 대한 PAC-Bayes 비무작위화 (derandomization)를 연구합니다. 우리의 목표는 손실 함수와 예측기 클래스 (predictor class) 모두의 매끄러움 (smoothness) 특성을 활용하여, 결정론적 예측기 (deterministic predictors)에 대해 높은 확률로 성립하는 일반화 경계 (generalization bounds)를 얻는 것입니다. 우리는 Gibbs 예측기에서 사후 평균 (posterior mean)에서의 결정론적 예측기로 넘어가는 과정이 Jensen gap 클래스의 일반화 간극 (generalization gap)에 의해 주어지는 정확한 비용을 갖는다는 것을 보여줍니다. 우리는 Rademacher 복잡도 (Rademacher complexity)를 통해 이 클래스를 제어하며, 이는 파라미터 Jacobian 및 스코어 맵 (score map)의 Hessian으로 표현되는 평탄도 (flatness) 양을 포함하는 결정론적 예측기에 대한 경계로 이어집니다. 이 프레임워크는 유계 (bounded) 및 무계 (unbounded) 매끄러운 손실 함수 모두에 적용되며, 우리는 결과를 선형 예측기 (linear predictors)와 매끄러운 신경망 (smooth neural networks)으로 특수화합니다. 마지막으로, 이론에 등장하는 Jacobian 및 Hessian 양은 실용적인 정규화 항 (regularizer)의 동기가 됩니다. BatchNorm 네트워크의 경우, BatchNorm 변환을 인접한 아핀 가중치 (affine weights)로 폴딩 (folding)하여 얻은 유효 BatchNorm 가중치 (effective BatchNorm weights)에 대해 이 정규화 항을 계산합니다. CIFAR-10에 대한 실험은 다양한 배치 크기 (batch sizes)에 따른 이 정규화 항의 동작을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0