arXiv논문2026. 05. 07. 19:02

Uno-Orchestra: 선택적 위임 기반 효율적인 에이전트 라우팅

요약

Uno-Orchestra는 기존 LLM 다중 에이전트 시스템의 한계인 경직된 오케스트레이션 문제를 해결하기 위해 개발되었습니다. 이 프레임워크는 작업을 선택적으로 분해하고, 각 서브태스크를 허용 가능한 (모델, 원시) 쌍으로 전송합니다. 특히, 작업 분해와 워커(모델) 선택이라는 두 가지 결정을 실제 워커 상호작용 기반의 커티드 RL 궤적에서 공동 최적화하여 높은 정확도와 효율성을 동시에 달성했습니다.

핵심 포인트

기존 LLM 에이전트 시스템은 경직된 오케스트레이션(평면 라우팅 또는 수동 분해)에 의존하여 최적화가 어려웠습니다.
Uno-Orchestra는 작업을 선택적으로 분해하고, 각 서브태스크를 (모델, 원시) 쌍으로 전송하는 방식을 도입했습니다.
작업 분해와 워커 선택을 커티드 RL(강화학습) 궤적에서 공동 최적화하여 성능과 효율성을 극대화했습니다.
다양한 벤치마크(수학, 코드, 지식 등)에서 Uno-Orchestra는 기존 최고 성능 대비 약 16% 높은 정확도를 달성하면서도 비용을 약 10배 절감했습니다.

대규모 언어 모델 (LLM) 다중 에이전트 시스템은 일반적으로 경직된 오케스트레이션을 기반으로 하며, 쿼리당 평평한 라우팅 또는 수동으로 설계된 작업 분해 중 하나에 의존합니다. 따라서 분해 깊이, 워커 선택, 추론 예산은 단일 목표 하에서 공동 최적화되지 않습니다. 우리는 Uno-Orchestra를 소개하며, 이는 작업을 선택적으로 분해하고 각 서브태스크를 허용 가능한 (모델, 원시) 쌍으로 전송하며, 두 결정은 실제 워커 상호작용에 기반한 커티드 RL(강화학습) 궤적에서 함께 학습됩니다. 22 개의 베이스라인과 비교하여 13 벤치마크 세트 (수학, 코드, 지식, 긴 컨텍스트, 에이전트 도구 사용 포함) 에서 Uno-Orchestra 는 77.0% 의 매크로 pass@1 을 달성하며, 가장 강력한 워크플로우 베이스라인 대비 약 16% 높은 성능을 보이며, 쿼리당 비용은 약 10 배 감소하여 선택적 위임의 정확도 - 효율성 경계를 발전시켰습니다.

AI 자동 생성 콘텐츠

원문 바로가기

Uno-Orchestra: 선택적 위임 기반 효율적인 에이전트 라우팅

요약

핵심 포인트

댓글