테스트 최적화를 위한 양자 애플리케이션 생성에 LLM 기반 에이전트 시스템 활용
요약
자연어 요구사항을 실행 가능한 양자 애플리케이션으로 변환하는 LLM 기반 멀티 에이전트 아키텍처 QPipe를 제안합니다. QPipe는 파싱부터 검증까지 특화된 에이전트들이 협업하여 높은 성공률과 기존 알고리즘 대비 우수한 성능을 보여줍니다.
핵심 포인트
- 자연어 요구사항을 양자 애플리케이션 워크플로우로 자동 전환
- 파싱, 코드 생성, 리뷰, 실행 등 특화된 멀티 에이전트 구조 활용
- 코드 컴파일 100%, 애플리케이션 실행 96.7%의 높은 성공률 달성
- 기존 유전 알고리즘 베이스라인보다 뛰어난 최적화 성능 입증
양자 컴퓨팅 (Quantum computing)은 소프트웨어 공학 (SE) 최적화를 위해 점점 더 많이 탐구되고 있지만, 자연어 (NL) 태스크 수준의 요구사항을 실행 가능한 양자 애플리케이션으로 변환하는 데에는 여전히 상당한 양자 및 프로그래밍 전문 지식이 필요합니다. 우리는 요구사항 파싱 (parsing), 공식화 (formulation), 코드 생성 (code generation), 리뷰 (review), 실행 (execution) 및 검증 (verification)을 위한 특화된 에이전트들을 통해 NL 요구사항을 추적 가능한 양자 애플리케이션 워크플로우로 자율적으로 전환하는 대규모 언어 모델 (LLM) 기반 멀티 에이전트 아키텍처인 QPipe를 제시합니다. 우리는 각각 실제 벤치마크 및 테스트 최적화 문제와 연관된 20개의 NL 요구사항에 대해 QPipe를 평가합니다. QPipe는 요구사항 전반에 걸쳐 양자 애플리케이션 생성의 핵심 단계를 성공적으로 완료하였으며, 코드 컴파일 (code compilation)에서 평균 100%, 애플리케이션 실행 (application execution) 및 최종 결과 결합 (final-result combination)에서 평균 96.7%의 성공률을 달성하였고, 요구사항당 평균 생성 비용은 260.1초 및 1.89M 토큰이었습니다. 성공적으로 실행된 생성된 양자 애플리케이션 중에서, 반환된 솔루션은 대부분의 경우 오프라인 유전 알고리즘 (genetic algorithm) 베이스라인보다 뛰어난 성능을 보였습니다. 절제 연구 (Ablation results) 결과는 QPipe의 이점이 코드 생성 기술, 태스크 지식, 리뷰 피드백 및 멀티 에이전트 분해 (multi-agent decomposition)를 유지하는 것에 달려 있음을 추가로 보여줍니다. 이러한 결과는 에이전트 협업 (agentic coordination)이 실제 벤치마크의 테스트 최적화 문제를 해결하기 위한 실행 가능한 양자 애플리케이션 생성을 지원할 수 있음을 나타냅니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기