arXiv논문2026. 05. 21. 12:15

양자 컴퓨팅을 통한 강화학습 (RL) 기반 공정 합성의 향상

요약

본 연구는 공정 합성 문제를 해결하기 위해 마르코프 결정 과정(MDP)으로 공식화된 양자 강화학습(Quantum RL) 프레임워크를 제안합니다. 기존 양자 RL의 한계였던 큐비트 요구 사항 문제를 해결하기 위해 상태 인코딩 알고리즘을 도입하여 확장성을 개선했습니다. 실험 결과, 양자 접근 방식은 중간 규모의 문제에서 고전적 RL 대비 파라미터 효율성 측면에서 우수한 성능을 입증했습니다.

핵심 포인트

공정 합성을 마르코프 결정 과정(MDP)으로 공식화하는 일반화된 프레임워크 개발
상태 인코딩(State Encoding) 알고리즘을 통해 큐비트 요구 사항과 문제 크기를 분리하여 확장성 확보
고전적 RL(Classical RL) 대비 파라미터당 높은 효율성을 가진 양자 강화학습 모델 제시
공정 시스템 공학 분야에서 양자 컴퓨팅 응용을 위한 벤치마크 구축

본 연구에서는 공정 합성 (Process Synthesis) 문제를 해결하기 위한 전략으로서 양자 강화학습 (Quantum Reinforcement Learning, RL)을 제시합니다. 이전 연구를 바탕으로, 우리는 공정 합성을 마르코프 결정 과정 (Markov Decision Process, MDP)으로 공식화하는 일반화된 프레임워크를 개발하였으며, 개선된 확장성 (Scalability)을 바탕으로 이를 해결하기 위한 양자 강화 (Quantum-enhanced) RL 알고리즘을 도입합니다. 공정 합성을 위한 기존의 양자 기반 RL 구현은 큐비트 (Qubit) 요구 사항에 의해 제한되었으며, 이는 문제의 복잡성에 따라 확장성이 낮았습니다. 본 연구는 큐비트 요구 사항을 문제 크기와 분리하기 위한 상태 인코딩 (State Encoding) 알고리즘을 도입함으로써 이러한 과제를 극복합니다. 동일한 학습 조건 하에서 양자 알고리즘을 벤치마킹하기 위해 고전적 RL (Classical RL) 기반 솔루션 전략을 베이스라인 (Baseline)으로 사용합니다. 모든 알고리즘은 성능과 확장성을 분석하기 위해 유닛 (Unit) 수가 증가하는 공정 흐름도 합성 (Flowsheet Synthesis) 문제를 통해 평가됩니다. 결과에 따르면, 모든 접근 방식은 작은 설계 공간 (Design Space)에서 최적의 흐름도 설계를 식별할 수 있음을 보여줍니다. 중간 규모의 유닛 수에 대해, 양자 접근 방식은 고전적 RL 벤치마크와 비교했을 때 에피소드당 (Per-episode) 측면에서 경쟁력 있는 성능을 보여주며, 파라미터당 (Per-parameter) 측면에서는 향상된 효율성을 입증합니다. 본 연구는 공정 시스템 공학 (Process Systems Engineering) 분야 내에서 향후 양자 컴퓨팅 응용을 위한 토대를 제공하고, 고전적 알고리즘과 양자 알고리즘을 비교하기 위한 통제된 벤치마크를 구축하며, 제안된 양자 변형 모델들이 본 연구에서 조사된 공정 합성 문제에 대해 경쟁력을 유지함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

양자 컴퓨팅을 통한 강화학습 (RL) 기반 공정 합성의 향상

요약

핵심 포인트

댓글