본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 21. 11:52

지연 시간 최적화를 위한 웹 에이전트 계획 및 스케줄링용 에이전트 JIT 컴파일

요약

컴퓨터 사용 에이전트(CUA)의 높은 지연 시간과 오류 문제를 해결하기 위해 에이전트 적시 컴파일(Agent JIT Compilation) 방식을 제안합니다. 이 방식은 자연어 작업을 실행 가능한 코드로 직접 컴파일하여 LLM 호출을 줄이고, JIT-Planner와 JIT-Scheduler를 통해 실행 속도와 정확도를 획기적으로 향상시킵니다.

핵심 포인트

  • 기존의 순차적인 fetch-screenshot-execute 루프 방식이 가진 높은 지연 시간과 오류 문제를 지적함
  • 작업 설명을 LLM 호출, 도구 호출, 병렬화가 포함된 코드로 직접 컴파일하는 JIT 방식 도입
  • JIT-Planner를 통해 Browser-Use 대비 10.4배의 속도 향상과 28%의 정확도 향상 달성
  • JIT-Scheduler를 통해 OpenAI CUA 대비 2.4배의 속도 향상과 9%의 정확도 향상 달성
  • 불변량 강제 도구 프로토콜을 통해 잘못된 도구 사용을 방지하는 상태 요구 사항 지정

컴퓨터 사용 에이전트 (Computer-use agents, CUA)는 브라우저에서 클릭(click), 타이핑(type), 스크롤(scroll)과 같은 도구 호출 시퀀스를 생성함으로써 "Taco Bell에서 가장 저렴한 아이템을 주문해줘"와 같이 자연어로 지정된 작업을 자동화합니다. 현재의 구현 방식은 각 반복마다 LLM 호출이 필요한 순차적인 fetch-screenshot-execute 루프를 따르며, 이는 높은 지연 시간 (latency)과 잘못된 도구 사용으로 인한 빈번한 오류를 초래합니다. 본 논문에서는 작업 설명을 LLM 호출, 도구 호출 및 병렬화 (parallelization)를 자유롭게 포함할 수 있는 실행 가능한 코드로 직접 컴파일하는 대안인 에이전트 적시 컴파일 (agent just-in-time (JIT) compilation)을 제시합니다. 우리의 접근 방식은 세 가지 구성 요소로 이루어집니다: (1) 여러 코드 계획을 생성하고, 각 계획을 도구 사양에 따라 검증하며, 최소 비용의 후보를 선택하는 JIT-Planner; (2) 학습된 지연 시간 분포로부터 Monte Carlo 비용 추정을 통해 병렬화 전략을 탐색하는 JIT-Scheduler; (3) 잘못된 도구 사용이 포함된 계획의 생성률을 줄이기 위해 전제 조건(precondition) 및 사후 조건(postcondition) 상태 요구 사항을 지정하는 불변량 강제 도구 프로토콜 (invariant-enforcing tool protocol)입니다. 5개의 웹 애플리케이션에 걸쳐, JIT-Planner는 Browser-Use 대비 $10.4 imes$의 속도 향상과 $+28%$의 정확도 향상을 달성하였으며, JIT-Scheduler는 OpenAI CUA 대비 $2.4 imes$의 속도 향상과 $+9%$의 정확도 향상을 달성하였습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0