테스트 최적화를 위한 양자 애플리케이션 생성에 LLM 기반 에이전트 시스템 활용

양자 컴퓨팅 (Quantum computing)은 소프트웨어 공학 (SE) 최적화를 위해 점점 더 많이 탐구되고 있지만, 자연어 (NL) 태스크 수준의 요구사항을 실행 가능한 양자 애플리케이션으로 변환하는 데에는 여전히 상당한 양자 및 프로그래밍 전문 지식이 필요합니다. 우리는 요구사항 파싱 (parsing), 공식화 (formulation), 코드 생성 (code generation), 리뷰 (review), 실행 (execution) 및 검증 (verification)을 위한 특화된 에이전트들을 통해 NL 요구사항을 추적 가능한 양자 애플리케이션 워크플로우로 자율적으로 전환하는 대규모 언어 모델 (LLM) 기반 멀티 에이전트 아키텍처인 QPipe를 제시합니다. 우리는 각각 실제 벤치마크 및 테스트 최적화 문제와 연관된 20개의 NL 요구사항에 대해 QPipe를 평가합니다. QPipe는 요구사항 전반에 걸쳐 양자 애플리케이션 생성의 핵심 단계를 성공적으로 완료하였으며, 코드 컴파일 (code compilation)에서 평균 100%, 애플리케이션 실행 (application execution) 및 최종 결과 결합 (final-result combination)에서 평균 96.7%의 성공률을 달성하였고, 요구사항당 평균 생성 비용은 260.1초 및 1.89M 토큰이었습니다. 성공적으로 실행된 생성된 양자 애플리케이션 중에서, 반환된 솔루션은 대부분의 경우 오프라인 유전 알고리즘 (genetic algorithm) 베이스라인보다 뛰어난 성능을 보였습니다. 절제 연구 (Ablation results) 결과는 QPipe의 이점이 코드 생성 기술, 태스크 지식, 리뷰 피드백 및 멀티 에이전트 분해 (multi-agent decomposition)를 유지하는 것에 달려 있음을 추가로 보여줍니다. 이러한 결과는 에이전트 협업 (agentic coordination)이 실제 벤치마크의 테스트 최적화 문제를 해결하기 위한 실행 가능한 양자 애플리케이션 생성을 지원할 수 있음을 나타냅니다.

Insights

테스트 최적화를 위한 양자 애플리케이션 생성에 LLM 기반 에이전트 시스템 활용

요약

핵심 포인트

댓글

토큰화 (Tokenisation) 규제가 구축됨에 따라 Valereum은 상업 운영 단계로 진입

미세 조정 (Fine-Tuning)을 위한 합성 데이터 (Synthetic Data): 생성, 필터링 및 모델 붕괴 (Model

Claude Sonnet 5 출시: Claude Code 기본 적용 및 1M 컨텍스트 지원

Microsoft 주식 팬들에게 알립니다, 8월 1일을 달력에 표시하세요

미세 조정 (Fine-Tuning)을 위한 합성 데이터 (Synthetic Data): 생성, 필터링 및 모델 붕괴 (Model

Claude Sonnet 5 출시: Claude Code 기본 적용 및 1M 컨텍스트 지원

Microsoft 주식 팬들에게 알립니다, 8월 1일을 달력에 표시하세요