에이전트적 진화 (Agentic Evolution) 활용하기
요약
에이전트적 진화(Agentic evolution)는 후보 생성, 평가, 피드백을 통해 솔루션을 개선하는 강력한 패러다임이지만, 기존 방법들은 경직된 수동 설계 절차를 따르거나 장기적인 경로 이탈 위험이 있는 범용 에이전트로 구현되어 증거 정리 및 진화 주도 메커니즘에 안정적인 인터페이스가 부족하다. 본 논문은 이러한 한계를 해결하기 위해 '상호작용형 환경'을 공식화하고, 축적된 진화 컨텍스트를 프로세스 수준의 상태로 활용하는 AEvo라는 제어된 메타 편집(meta-editing) 프레임워크를 제안한다. AEvo는 메타 에이전트가 다음 후보를 직접 제안하는 대신, 향후 진화를 제어하는 절차나 에이전트 컨텍스트 자체를 편집함으로써 절차 기반 및 에이전트 기반 진화 모두를 조종하며 뛰어난 성능을 입증했다.
핵심 포인트
- 에이전트적 진화는 솔루션 개선의 강력한 패러다임이지만, 기존 방법들은 인터페이스 부족으로 한계가 있다.
- AEvo는 축적된 진화 컨텍스트를 프로세스 수준의 상태로 활용하는 '제어된 메타 편집(meta-editing)' 프레임워크이다.
- AEvo는 다음 후보 제안을 넘어, 향후 진화를 제어하는 절차나 에이전트 컨텍스트 자체를 편집하여 작동한다.
- 이 통합 인터페이스 덕분에 AEvo는 절차 기반 및 에이전트 기반 진화 모두를 효과적으로 조종할 수 있다.
- 실증적 평가 결과, AEvo는 기존 5개 이상의 진화 베이스라인 대비 우수한 성능을 달성했다.
에이전트적 진화 (Agentic evolution)는 후보를 반복적으로 생성하고, 이를 평가하며, 피드백을 사용하여 향후 탐색을 안내함으로써 프로그램, 워크플로 및 과학적 솔루션을 개선하는 강력한 패러다임으로 부상했습니다. 그러나 기존 방법들은 일반적으로 모듈화되어 있지만 경직된 고정된 수동 설계 절차(fixed hand-designed procedures)로 구현되거나, 피드백을 유연하게 통합하지만 장기적 진화 (long-horizon evolution) 과정에서 경로를 이탈할 수 있는 범용 에이전트 (general-purpose agents)로 구현됩니다. 두 형태 모두 후보, 피드백, 추적 (traces), 실패 사례를 포함하여 시간이 지남에 따라 풍부한 증거를 축적하지만, 이러한 증거를 정리하고 향후 진화를 주도하는 메커니즘을 수정하기 위한 안정적인 인터페이스가 부족합니다. 우리는 에이전트적 진화를 상호작용형 환경 (interactive environment)으로 공식화하여 이 한계를 해결하며, 여기서 축적된 진화 컨텍스트 (evolution context)는 프로세스 수준의 상태 (process-level state) 역할을 합니다. 우리는 AEvo를 소개하는데, 이는 메타 에이전트 (meta-agent)가 이 상태를 관찰하고 다음 후보를 직접 제안하는 것이 아니라, 향후 진화를 제어하는 절차나 에이전트 컨텍스트를 편집함으로써 동작하는 제어된 메타 편집 (meta-editing) 프레임워크입니다. 이 통합된 인터페이스를 통해 AEvo는 절차 기반 및 에이전트 기반 진화를 모두 조종할 수 있으며, 축적된 증거를 장기 탐색 (long-horizon search)을 위해 실행 가능하게 만듭니다. 에이전트 및 추론 벤치마크에 대한 실증적 평가 결과, AEvo는 5개의 진화 베이스라인 (evolution baselines)보다 우수한 성능을 보였으며, 가장 강력한 베이스라인 대비 26%의 상대적 향상을 달성했습니다. 세 가지 개방형 최적화 (open-ended optimization) 작업 전반에서 AEvo는 4개의 진화 베이스라인을 추가로 능가하며 동일한 반복 예산 (iteration budget) 하에서 최첨단 (state-of-the-art) 성능을 달성했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기