SPOQ: 멀티 에이전트 소프트웨어 엔지니어링을 위한 전문가 오케스트레이션 큐잉
요약
SPOQ는 멀티 에이전트 시스템의 조정 오버헤드와 품질 문제를 해결하기 위한 새로운 오케스트레이션 방법론입니다. 웨이브 기반 디스패치, 이중 검증 게이트, 인간 참여형(HaaA) 구조를 통해 소프트웨어 엔지니어링 작업의 속도와 정확도를 획기적으로 높였습니다.
핵심 포인트
- 웨이브 기반 디스패치로 최대 14.3배 실행 가속 달성
- 이중 검증 게이트를 통한 결함 감소 및 테스트 통과율 향상
- 인간 전문가 참여(HaaA)로 잔류 결함 최소화
- 모델 계층 구조를 활용한 비용-품질 최적화 구현
멀티 에이전트 (Multi-agent) AI 시스템은 소프트웨어 엔지니어링 작업을 자동화하는 데 유망한 가능성을 보여주지만, 기존 방식들은 조정 오버헤드 (coordination overhead), 품질 관리 격차, 그리고 제한된 인간 감독 문제로 어려움을 겪고 있습니다. 우리는 세 가지 혁신을 결합한 방법론인 SPOQ (Specialist Orchestrated Queuing)를 소개합니다: (1) 작업 의존성 그래프 (task dependency graphs)로부터 병렬 실행 웨이브 (parallel execution waves)를 계산하는 웨이브 기반 위상 디스패치 (wave-based topological dispatch); (2) 재작업 사이클을 줄이기 위해 실행 전(계획 검증, planning validation)과 실행 후(코드 검증, code validation)에 품질 지표를 적용하는 이중 검증 게이트 (dual validation gates); (3) 인간 전문가가 분해 과정에 참여하고 실행 중에 자문을 구할 수 있는 Human-as-an-Agent (HaaA) 통합입니다. SPOQ는 비용-품질 트레이드오프 (cost-quality tradeoffs)를 최적화하기 위해 3단계 에이전트 계층 구조 (Opus 워커, Sonnet 리뷰어, Haiku 조사관)를 사용합니다. 우리는 네 가지 실험을 통해 SPOQ를 평가합니다. 실험 1: 웨이브 디스패치는 임계 경로 하한선 (critical-path lower bound)에 근접하며 (비율 1.03--1.11, 최대 14.3배 가속), 2슬롯 로컬 백엔드에서 안정적인 1.4배 가속을 제공합니다. 실험 2: SPOQ는 계획 커버리지 (planning coverage)를 93.0에서 99.75로 개선하고, 순환 계획 (cyclic plans)을 제거하며, 병렬성 (parallelism)을 31.0에서 75.25로 높입니다. 실험 3: 이중 검증은 작업당 결함을 0.34에서 0.20으로 줄이고 테스트 통과율을 91.25%에서 99.75%로 높입니다. 실험 4: 인간 리뷰는 작업당 잔류 결함을 0.47에서 0.03으로 줄입니다. 결과는 로컬에 호스팅된 오픈 웨이트 모델 (open-weights model, Qwen3.6-35B-A3B)에서도 재현되어, 성능 향상이 특정 모델이 아닌 오케스트레이션 (orchestration)에 기인함을 검증했습니다. 17개 저장소, 8,589개 커밋, 1,822개 작업, 13,866개 테스트 (99.87% 통과율)에 걸친 종단적 연구 (longitudinal study)를 통해 생태학적 검증 (ecological validation)을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기