표현력-학습 가능성 역설을 넘어: 양자 기계 학습(QML)의 바렌 플레이토(Barren Plateaus) 탐색을 위한 동적 리
요약
양자 기계 학습(QML)에서 발생하는 바렌 플레이토(Barren Plateaus) 현상의 수학적 원인을 분석하고, 이를 해결하기 위한 동적 리 대수(DLA) 기반의 프레임워크를 제안합니다. 대칭 보존 접근 방식을 통해 학습 가능한 기울기 지형을 확보함으로써 확장 가능한 양자 신경망 설계 로드맵을 제시합니다.
핵심 포인트
- 표현력-학습 가능성 역설로 인한 양자 과소적합 문제 규명
- 방대한 힐베르트 공간이 바렌 플레이토의 수학적 원인임을 입증
- 동적 리 대수(DLA)를 활용한 구조적 정규화 기법 제안
- 대칭 보존 설계를 통한 확장 가능한 양자 신경망 학습 가능성 확보
양자 기계 학습 (Quantum Machine Learning, QML)이 실제 구현 단계로 전환됨에 따라, 이 분야는 고전 통계 학습 이론의 근본적인 가정에 도전하는 중대한 구조적 병목 현상에 직면해 있습니다. 고전적인 딥러닝 (Deep Learning)에서는 모델 용량 (Model Capacity)을 늘리는 것이 일반적으로 과적합 (Overfitting)의 위험을 수반합니다. 그러나 본 연구는 직관에 반하는 패러다임을 제시합니다. 구조화되지 않은 현대의 QML 아키텍처는 "표현력-학습 가능성 역설 (Expressivity-Trainability Paradox)"로 인해 심각한 양자 과소적합 (Quantum Underfitting) 상태를 겪습니다. 우리는 전통적으로 양자 우위 (Quantum Advantage)의 원천으로 추구되어 온 매개변수화된 양자 회로 (Parameterized Quantum Circuits, PQCs)의 방대한 힐베르트 공간 (Hilbert Space) 용량이, 기울기 지형 (Gradient Landscapes)이 지수적으로 평탄해지는 바렌 플레이토 (Barren Plateaus, BPs)의 직접적인 수학적 원인임을 입증합니다. 동적 리 대수 (Dynamical Lie Algebras, DLAs)와 기하학적 QML (Geometric QML) 분야의 최근 돌파구들을 합성함으로써, 우리는 회로 생성기 (Circuit Generators)의 대수적 차원과 최적화 역학 (Optimization Dynamics)을 연결하는 포괄적인 프레임워크를 구축합니다. 나아가, 우리는 비선형 이진 분류 (Non-linear Binary Classification) 과업을 통해 이 프레임워크를 경험적으로 검증하며, 편향-분산 트레이드오프 (Bias-Variance Tradeoff)의 독특한 양자적 발현을 밝혀냅니다. 즉, 구조화되지 않은 아키텍처는 확장 불가능한 매개변수화 (Unscalable Parameterization)를 통해 거의 완벽한 훈련 정확도(양자 과적합, Quantum Overfitting)를 달성하는 반면, 군론적 기하학적 사전 정보 (Group-theoretic Geometric Priors)를 삽입하는 것은 구조적 정규화제 (Structural Regularizer) 역할을 합니다. DLA의 성장을 다항식 영역 (Polynomial Regime)으로 제한함으로써, 우리의 대칭 보존 (Symmetry-preserving) 접근 방식은 가공되지 않은 암기 용량 (Raw Memorization Capacity)을 희생하는 대신 확장 가능하고 기울기가 풍부한 훈련 지형을 보장하며, 확장 가능한 양자 신경망 (Quantum Neural Networks)에서의 "설계에 의한 학습 가능성 (Trainability-by-Design)"을 위한 강력한 로드맵을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기