arXiv논문2026. 05. 27. 12:03

SQARL: 분산 양자 아키텍처 내 회로 할당을 위한 크기 불가지론적 강화학습 (Reinforcement Learning) 접근 방식

요약

분산 양자 컴퓨팅 환경에서 통신 비용을 최소화하기 위한 큐비트 할당 문제를 해결하는 Transformer 기반 강화학습 아키텍처 SQARL을 제안합니다. 이 방식은 하드웨어 구성 변화에 관계없이 재학습 없이 작동하며, 기존 휴리스틱 알고리즘 대비 우수한 성능을 보여줍니다.

핵심 포인트

Transformer 기반 아키텍처로 하드웨어 크기에 구애받지 않는 유연성 확보
재학습 없이 임의의 큐비트 및 코어 수에 대응 가능
Cuccaro Adder에서 HQA 대비 할당 비용 33% 감소
무작위 회로에서 평균 25%의 비용 감소 달성

양자 프로세서의 확장(Scaling)은 현재 결맞음(Decoherence) 및 크로스토크(Cross-talk)와 같은 기술적 과제로 인해 제한을 받고 있습니다. 큐비트(Qubit)의 수가 증가함에 따라 간섭이 심화되어 계산 노이즈가 증가합니다. 분산 양자 컴퓨팅(Distributed quantum computing)은 더 작고 다루기 쉬운 양자 프로세서(코어)들을 상호 연결함으로써 이러한 한계를 해결하지만, 느리고 오류가 발생하기 쉬운 코어 간 통신을 최소화해야 하는 과제를 안겨줍니다. 통신 비용을 최소화하면서 양자 회로를 코어에 분산시키는 작업은 큐비트 할당(Qubit Allocation) 문제로 알려져 있습니다. 본 연구는 이 문제에 대한 딥러닝 (Deep learning) 접근 방식을 개발하는 데 중점을 두며, 양자 하드웨어 토폴로지(Topology)에 대한 유연성을 강조하고 최첨단(State-of-the-art) 성능을 개선하는 데 집중합니다. 현재는 Hungarian Qubit Allocation (HQA)과 같은 휴리스틱(Heuristic) 및 비학습 알고리즘이 최첨단 기술을 나타냅니다. 강화학습 (Reinforcement Learning, RL) 접근 방식은 학습된 할당 정책을 활용하지만, 하드웨어 구성이 변경될 때 재학습이 필요하여 유연성이 부족한 경우가 많으며, 비학습 방법이 달성하는 솔루션 품질에 미치지 못합니다. 그러나 학습 메커니즘은 인간이 설계한 휴리스틱을 능가할 수 있습니다. 이러한 한계를 극복하기 위해, 본 연구는 재학습 없이 임의의 수의 큐비트와 코어를 처리할 수 있는 유연한 트랜스포머(Transformer) 기반 아키텍처를 제안합니다. 결과에 따르면, 학습된 정책은 기존의 RL 최첨단 성능을 일관되게 능가하며, 가장 일반적인 회로들에 대해 RL과 HQA 사이의 격차를 좁힙니다. Cuccaro Adder의 경우 HQA 대비 할당 비용을 33% 감소시켰으며, 무작위 회로(Random circuits)에 대해서는 평균 25%를 감소시켰습니다. 이러한 발견은 학습 기반 접근 방식이 수작업으로 제작된 휴리스틱의 성능에 효과적으로 부합할 수 있음을 보여주며, 이는 실제 시나리오 적용을 향한 중요한 단계입니다.

AI 자동 생성 콘텐츠

원문 바로가기

SQARL: 분산 양자 아키텍처 내 회로 할당을 위한 크기 불가지론적 강화학습 (Reinforcement Learning) 접근 방식

요약

핵심 포인트

댓글