arXiv논문2026. 05. 22. 11:19

에이전트 워크플로우를 LLM 가중치로 컴파일하기: 2단계 낮은 비용으로 최첨단(Near-Frontier) 품질 달성

요약

기존의 외부 오케스트레이터 방식 대신 에이전트 워크플로우를 소규모 모델의 가중치로 직접 컴파일하는 '지하 에이전트' 기술을 제안합니다. 이를 통해 컨텍스트 소모와 비용 문제를 해결하고 최첨단 모델에 근접한 성능을 달성할 수 있음을 입증합니다.

핵심 포인트

외부 오케스트레이터 없이 워크플로우를 모델 가중치에 내장
컨텍스트 윈도우 소모 및 높은 추론 비용 문제 해결
소규모 미세 조정 모델로 최첨단 품질의 에이전트 구현
여행 예약, Zoom 지원 등 복잡한 시나리오를 통한 실증

에이전트 오케스트레이션 (Agent orchestration) 프레임워크가 급증하여 LangGraph, CrewAI, Google ADK, OpenAI Agents SDK, Semantic Kernel, Strands, LlamaIndex를 통틀어 GitHub 스타 수가 290,000개를 넘어섰습니다. 이들은 모두 동일한 패턴을 따릅니다. 즉, LLM 상단에 외부 오케스트레이터 (orchestrator)를 두어 매 턴마다 지침을 주입하고 라우팅 결정 (routing decisions)을 내리는 방식입니다. 최근 연구에 따르면, 절차적 작업 (procedural tasks)의 경우 최첨단 모델 (frontier model)의 시스템 프롬프트 (system prompt)에 단순히 절차를 제공하는 것만으로도 이 아키텍처를 압도할 수 있음이 밝혀졌습니다 [Dennis et al., 2026a]. 하지만 이는 컨텍스트 윈도우 (context window)를 소모하고, 모든 대화마다 최첨단 모델이 필요하며, 독점적인 절차를 제3자 제공업체에 노출해야 한다는 비용이 따릅니다. 절차를 소규모 미세 조정 (fine-tuned) 모델의 가중치 (weights)로 컴파일하여 '지하 에이전트 (subterranean agent)'를 생성하는 방식은 이러한 모든 우려를 해결할 수 있어야 하며, 이전 연구들 (SimpleTOD, FireAct, SynTOD, WorkflowLLM, Agent Lumos)은 이 기술이 작동함을 보여주었습니다. 그럼에도 불구하고 개발자들의 채택은 압도적으로 오케스트레이션 (orchestration) 방식을 선호해 왔습니다. 본 연구에서는 세 가지 인지된 장벽을 식별하고, 여행 예약 (14개 노드), Zoom 지원 (14개 노드, 제품 특화 지식), 보험 청구 (55개 노드, 6개 결정 허브)를 통해 각 장벽을 실증적으로 다룹니다.

AI 자동 생성 콘텐츠

원문 바로가기

에이전트 워크플로우를 LLM 가중치로 컴파일하기: 2단계 낮은 비용으로 최첨단(Near-Frontier) 품질 달성

요약

핵심 포인트

댓글