arXiv논문2026. 05. 21. 11:10

AutoRPA: LLM 기반 상호작용을 통한 코드 합성 기반의 효율적인 GUI 자동화

요약

AutoRPA는 LLM 에이전트의 ReAct 방식이 가진 비효율성을 해결하기 위해, 에이전트의 의사결정 로직을 견고한 RPA 함수로 자동 증류하는 프레임워크입니다. 번역기-빌더 파이프라인과 하이브리드 복구 전략을 통해 반복적인 GUI 작업을 위한 코드를 합성하며, 기존 방식 대비 토큰 사용량을 최대 96%까지 절감합니다.

핵심 포인트

ReAct 패러다임의 반복적인 LLM 호출로 인한 비효율성을 RPA 함수 합성으로 해결
번역기-빌더 파이프라인을 통해 ReAct 액션을 소프트코딩된 절차 및 RPA 함수로 변환
RAG를 활용하여 여러 궤적(trajectories)으로부터 견고한 코드를 생성하는 빌더 에이전트 도입
RPA 실행과 ReAct 기반 폴백을 결합한 하이브리드 복구 전략으로 코드 검증 및 개선
기존 방식 대비 토큰 사용량을 82%~96% 감소시켜 실행 효율성과 재사용성 극대화

대규모 언어 모델 (LLM) 기반 에이전트들은 그래픽 사용자 인터페이스 (GUI)와의 다단계 상호작용에서 숙련도를 입증해 왔습니다. 대부분의 연구가 단일 작업 성능을 향상시키는 데 집중하고 있는 반면, 실제 시나리오에서는 반복적인 GUI 작업이 빈번하게 발생하며, 이러한 작업에 대해 LLM 추론을 반복적으로 호출하는 방식, 즉 ReAct 패러다임은 비효율적입니다. LLM이 등장하기 전의 전통적인 로봇 프로세스 자동화 (RPA)는 실행 시간 효율성은 높지만, 개발 및 유지보수를 위해 상당한 수동 노력이 요구됩니다. 이러한 격차를 해소하기 위해, 우리는 ReAct 스타일 에이전트의 의사결정 로직을 견고한 RPA 함수로 자동 증류(distill)하는 프레임워크인 AutoRPA를 제안합니다. AutoRPA는 두 가지 핵심 혁신을 도입합니다: (1) 번역기-빌더 (translator-builder) 파이프라인으로, 번역기 에이전트가 하드코딩된 ReAct 액션을 소프트코딩된 절차로 변환하고, 빌더 에이전트가 여러 궤적 (trajectories)에 대한 검색 증강 생성 (RAG)을 통해 견고한 RPA 함수를 합성합니다; (2) 코드 검증 과정에서의 하이브리드 복구 전략으로, 반복적인 개선을 위해 RPA 실행과 ReAct 기반의 폴백 (fallback)을 결합합니다. 다양한 GUI 환경에서의 실험을 통해, AutoRPA가 생성한 RPA 함수가 유사한 작업들을 성공적으로 해결하는 동시에 토큰 사용량을 82%에서 96%까지 줄여, 실행 효율성과 재사용성을 크게 향상시킴을 입증했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AutoRPA: LLM 기반 상호작용을 통한 코드 합성 기반의 효율적인 GUI 자동화

요약

핵심 포인트

댓글