RunAgent: 제약 조건에 기반한 자연어 계획의 해석 및 단계별 실행

인간은 문제를 해결하기 위해 표적화된 계획을 실행하지만, 대규모 언어 모델 (LLMs) 은 구조화된 워크플로우 실행에 여전히 신뢰할 수 없습니다. 우리는 RunAgent 를 제안합니다. RunAgent 는 자연어 계획을 해석하고 제약 조건 및 규칙을 통해 단계별 실행을 강제하는 다중 에이전트 계획 실행 플랫폼입니다. RunAgent 는 명시적 제어 구조 (예: \texttt{IF}, \texttt{GOTO}, \texttt{FORALL}) 를 갖춘 에이전트 언어를 통해 자연어의 표현력과 프로그래밍의 결정론적 특성을 연결합니다. RunAgent 는 각 단계의 특정 지침에 따라 단계 출력의 문법 및 의미 검증 (syntactic and semantic verification) 을 수행하는 것을 넘어, 작업 및 그 인스턴스의 설명을 기반으로 각 단계에서 제약 조건을 자동으로 유도하고 검증합니다. RunAgent 는 LLM 기반 추론, 도구 사용, 코드 생성 및 실행 (예: Python) 을 동적으로 선택하며, 정확성을 보장하기 위해 오류 수정 메커니즘을 통합합니다. 마지막으로, RunAgent 는 각 단계의 실행 중 관련 정보만 유지하여 컨텍스트 역사를 필터링합니다. Natural-plan 및 SciBench 데이터셋에 대한 평가는 RunAgent 가 베이스라인 LLM 과 최첨단 PlanGEN 방법보다 우월함을 입증했습니다.

Insights

RunAgent: 제약 조건에 기반한 자연어 계획의 해석 및 단계별 실행

요약

핵심 포인트

댓글

AI 인프라 논쟁이 진화함에 따라 Nvidia, Vera CPU 전략 강조

영국 데이터 센터 소유주, 140억 파운드 규모의 미국 기업 인수 제안 수용 예정

디지털 자산을 위한 새로운 벤치마크 지수 등장 — 비트코인은 제외되었다

Bank of America, AI 돌발 변수 이후 Micron 주식에 대한 투자 강화

영국 데이터 센터 소유주, 140억 파운드 규모의 미국 기업 인수 제안 수용 예정

디지털 자산을 위한 새로운 벤치마크 지수 등장 — 비트코인은 제외되었다

Bank of America, AI 돌발 변수 이후 Micron 주식에 대한 투자 강화