본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 07. 19:02

Uno-Orchestra: 선택적 위임 기반 효율적인 에이전트 라우팅

요약

Uno-Orchestra는 기존 LLM 다중 에이전트 시스템의 한계인 경직된 오케스트레이션 문제를 해결하기 위해 개발되었습니다. 이 프레임워크는 작업을 선택적으로 분해하고, 각 서브태스크를 허용 가능한 (모델, 원시) 쌍으로 전송합니다. 특히, 작업 분해와 워커(모델) 선택이라는 두 가지 결정을 실제 워커 상호작용 기반의 커티드 RL 궤적에서 공동 최적화하여 높은 정확도와 효율성을 동시에 달성했습니다.

핵심 포인트

  • 기존 LLM 에이전트 시스템은 경직된 오케스트레이션(평면 라우팅 또는 수동 분해)에 의존하여 최적화가 어려웠습니다.
  • Uno-Orchestra는 작업을 선택적으로 분해하고, 각 서브태스크를 (모델, 원시) 쌍으로 전송하는 방식을 도입했습니다.
  • 작업 분해와 워커 선택을 커티드 RL(강화학습) 궤적에서 공동 최적화하여 성능과 효율성을 극대화했습니다.
  • 다양한 벤치마크(수학, 코드, 지식 등)에서 Uno-Orchestra는 기존 최고 성능 대비 약 16% 높은 정확도를 달성하면서도 비용을 약 10배 절감했습니다.

대규모 언어 모델 (LLM) 다중 에이전트 시스템은 일반적으로 경직된 오케스트레이션을 기반으로 하며, 쿼리당 평평한 라우팅 또는 수동으로 설계된 작업 분해 중 하나에 의존합니다. 따라서 분해 깊이, 워커 선택, 추론 예산은 단일 목표 하에서 공동 최적화되지 않습니다. 우리는 Uno-Orchestra를 소개하며, 이는 작업을 선택적으로 분해하고 각 서브태스크를 허용 가능한 (모델, 원시) 쌍으로 전송하며, 두 결정은 실제 워커 상호작용에 기반한 커티드 RL(강화학습) 궤적에서 함께 학습됩니다. 22 개의 베이스라인과 비교하여 13 벤치마크 세트 (수학, 코드, 지식, 긴 컨텍스트, 에이전트 도구 사용 포함) 에서 Uno-Orchestra 는 77.0% 의 매크로 pass@1 을 달성하며, 가장 강력한 워크플로우 베이스라인 대비 약 16% 높은 성능을 보이며, 쿼리당 비용은 약 10 배 감소하여 선택적 위임의 정확도 - 효율성 경계를 발전시켰습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0