양자 커널 밴딧 최적화에서의 표현력과 학습 가능성 사이의 균형
요약
양자 커널을 이용한 가우시안 프로세스(GP) 밴딧 최적화에서 모델 복잡도와 학습 가능성 사이의 균형을 연구합니다. 특징 차원을 줄이는 투영된 양자 커널과 고전적 근사 기술을 통해 누적 후회를 줄이고 샘플 효율성을 높이는 방법을 제안합니다.
핵심 포인트
- 양자 커널의 고차원 특성으로 인한 높은 누적 후회 문제 해결
- 투영된 양자 커널 및 고전적 커널 근사 기술 제안
- 근사 오차와 정보 이득 사이의 트레이드오프를 분석하는 후회 경계 도출
- 전체 양자 커널 대비 높은 샘플 효율성 및 계산 오버헤드 감소 입증
우리는 평균 보상 함수가 양자 커널 (quantum kernel)에 의해 유도된 재생 커널 힐베르트 공간 (reproducing kernel Hilbert space (RKHS))에 존재한다고 가정할 때, 양자 커널을 이용한 가우시안 프로세스 (Gaussian process (GP)) 밴딧 최적화 (bandit optimization)를 조사합니다. 이러한 설정은 양자 제어 (quantum control), 상태 준비 (state preparation) 및 변분 양자 알고리즘 (variational quantum algorithms)과 같은 NISQ 시대의 작업들에 의해 동기 부여되었습니다. 양자 커널은 도메인 특화된 귀납적 편향 (inductive biases)을 통해 '양자 우위 (quantum advantage)'를 제공할 수 있지만, 고차원의 전체 커널을 무분별하게 사용하는 것은 모델 복잡도와 정보 이득 (information gain)을 증가시켜, 더 높은 누적 후회 (cumulative regret)와 낮은 학습 가능성 (learnability)으로 이어집니다. 이를 해결하기 위해, 우리는 핵심적인 양자 특성을 보존하면서 특징 차원 (feature dimensionality)을 줄이는 투영된 양자 커널 (projected quantum kernels) 및 고전적 커널 근사 (classical kernel approximation) 기술을 제안합니다. 이러한 근사 커널을 사용하여, 우리는 오설정된 (misspecified) GP 밴딧 알고리즘을 개발하고 근사 오차 (approximation error)와 정보 이득 사이의 트레이드오프 (trade-off)를 특징짓는 후회 경계 (regret bounds)를 도출합니다. 이 후회 경계는 최적의 모델 복잡도를 선택하기 위한 원칙적인 가이드를 제공합니다. 실험적으로, 우리의 방법은 샘플 효율성 (sample efficiency) 측면에서 전체 양자 커널보다 뛰어난 성능을 보이며, 계산 오버헤드 (computational overhead)를 실질적으로 줄임으로써 양자 네이티브 (quantum-native) 애플리케이션을 위한 확장 가능한 GP 최적화를 가능하게 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기