본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 04. 19:28

RunAgent: 제약 조건에 기반한 자연어 계획의 해석 및 단계별 실행

요약

RunAgent는 자연어 계획을 해석하고 제약 조건과 규칙 기반의 단계별 실행을 강제하는 다중 에이전트 계획 실행 플랫폼입니다. 이 시스템은 명시적 제어 구조를 갖춘 전용 에이전트 언어를 사용하여, 자연어의 유연성과 프로그래밍의 결정론적 특성을 결합합니다. RunAgent는 단순한 검증을 넘어 작업 설명 기반으로 제약 조건을 자동으로 유도하고 적용하며, 오류 수정 메커니즘과 컨텍스트 필터링 기능을 통해 LLM 기반 워크플로우의 신뢰성과 정확도를 크게 향상시킵니다.

핵심 포인트

  • RunAgent는 자연어 계획을 구조화된 단계별 실행으로 변환하는 다중 에이전트 플랫폼입니다.
  • 명시적 제어 구조(IF, GOTO 등)를 갖춘 전용 언어를 통해 자연어의 표현력과 프로그래밍의 결정론적 특성을 결합합니다.
  • 단순한 문법/의미 검증을 넘어, 작업 설명 기반으로 동적으로 제약 조건을 유도하고 적용하여 정확도를 높입니다.
  • LLM 추론, 도구 사용, 코드 실행 등을 통합하며 오류 수정 메커니즘과 컨텍스트 필터링 기능을 제공합니다.

인간은 문제를 해결하기 위해 표적화된 계획을 실행하지만, 대규모 언어 모델 (LLMs) 은 구조화된 워크플로우 실행에 여전히 신뢰할 수 없습니다. 우리는 RunAgent 를 제안합니다. RunAgent 는 자연어 계획을 해석하고 제약 조건 및 규칙을 통해 단계별 실행을 강제하는 다중 에이전트 계획 실행 플랫폼입니다. RunAgent 는 명시적 제어 구조 (예: \texttt{IF}, \texttt{GOTO}, \texttt{FORALL}) 를 갖춘 에이전트 언어를 통해 자연어의 표현력과 프로그래밍의 결정론적 특성을 연결합니다. RunAgent 는 각 단계의 특정 지침에 따라 단계 출력의 문법 및 의미 검증 (syntactic and semantic verification) 을 수행하는 것을 넘어, 작업 및 그 인스턴스의 설명을 기반으로 각 단계에서 제약 조건을 자동으로 유도하고 검증합니다. RunAgent 는 LLM 기반 추론, 도구 사용, 코드 생성 및 실행 (예: Python) 을 동적으로 선택하며, 정확성을 보장하기 위해 오류 수정 메커니즘을 통합합니다. 마지막으로, RunAgent 는 각 단계의 실행 중 관련 정보만 유지하여 컨텍스트 역사를 필터링합니다. Natural-plan 및 SciBench 데이터셋에 대한 평가는 RunAgent 가 베이스라인 LLM 과 최첨단 PlanGEN 방법보다 우월함을 입증했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0