QAP-Router: 강화학습을 이용한 동적 이차 할당 문제로의 큐비트 라우팅 해결
요약
본 논문에서 제안하는 QAP-Router는 양자 컴파일링의 핵심 문제인 큐비트 라우팅을 동적 이차 할당 문제(QAP)로 공식화하여 해결합니다. 이 접근 방식은 양자 게이트를 흐름 행렬, 하드웨어 토폴로지를 거리 행렬로 모델링하고, 이를 통합된 목적 함수에 포함시켜 강화학습 환경의 보상으로 정의합니다. 솔루션 인식 트랜스포머 백본과 예측 메커니즘을 활용하여 근시안적 결정을 방지함으로써, 기존 컴파일러 대비 CNOT 게이트 수를 크게 줄이는 효과를 입증했습니다.
핵심 포인트
- 큐비트 라우팅 문제를 NP-hard인 동적 이차 할당 문제(QAP)로 공식화함.
- 양자 상호작용을 흐름 행렬, 하드웨어 토폴로지를 거리 행렬로 모델링하여 통합 목적 함수를 구축함.
- 솔루션 인식 트랜스포머 백본과 어텐션 메커니즘을 사용하여 복잡한 상호작용을 인코딩함.
- 예측(lookahead) 메커니즘을 추가하여 근시안적 결정의 한계를 극복함.
- 실제 양자 회로 데이터셋에서 기존 컴파일러 대비 CNOT 게이트 수를 평균적으로 크게 감소시키는 성능을 보임.
큐비트 라우팅은 양자 컴파일링에서 근본적인 문제이며, NP-hard로 알려져 있습니다. 그 역동적인 특성 때문에 국소적인 라우팅 결정이 시간에 따라 전파되고 복합되어 글로벌하게 효율적인 해법을 찾기 어렵게 만듭니다. 기존의 휴리스틱 방법들은 제한된 예측(lookahead)을 가진 국소 규칙에 의존하는 반면, 최근의 학습 기반 접근 방식들은 라우팅을 일반적인 순차적 결정 문제로 취급하며 그 근본적인 구조를 완전히 활용하지 못하는 경우가 많습니다. 본 논문에서는 큐비트 라우팅을 동적 이차 할당 문제(Quadratic Assignment Problem, QAP) 공식화에 기반하여 바라보는 QAP-Router를 소개합니다. 논리적 상호작용, 즉 양자 게이트를 흐름 행렬(flow matrices)로, 하드웨어 토폴로지를 거리 행렬(distance matrix)로 모델링함으로써, 우리의 접근 방식은 상호작용-거리 결합을 통합된 목적 함수에 포착하며, 이는 강화학습 환경에서 보상(reward)을 정의합니다. 이 구조를 더욱 활용하기 위해, 정책 네트워크는 솔루션 인식 트랜스포머 백본(solution-aware Transformer backbone)을 사용하여 흐름 행렬과 거리 행렬 간의 상호작용을 어텐션 메커니즘에 인코딩합니다. 또한, 근시안적인 결정(myopic decisions)을 방지하기 위해 QAP 프레임워크에 자연스럽게 통합되는 예측(lookahead) 메커니즘도 추가했습니다. MQTBench, AgentQ 및 QUEKO 데이터셋의 1,831개 실제 양자 회로에 대한 광범위한 실험 결과, 우리의 방법은 기존 산업용 컴파일러 대비 라우팅된 회로의 CNOT 게이트 수를 각각 15.7%, 30.4%, 12.1% 감소시키는 것을 보여주었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기