SkillPyramid: 자가 진화 에이전트를 위한 계층적 기술 통합 프레임워크
요약
SkillPyramid는 AI 에이전트가 경험을 재사용 가능한 자산으로 변환할 수 있도록 돕는 계층적 기술 통합 프레임워크입니다. 자가 진화 메커니즘을 통해 새로운 기술을 구성하고 검증하며, 기존의 정적인 기술 풀을 동적인 진화 시스템으로 전환합니다.
핵심 포인트
- 계층적 기술 토폴로지를 통한 기술 통합 프레임워크 제안
- 에이전트의 자가 진화(self-evolution) 메커니즘 도입
- 평균 보상 38.0% 증가 및 실행 단계 27.7% 감소 달성
- 기술 컬렉션을 정적 리소스에서 동적 시스템으로 변환
최근의 AI 에이전트들은 복잡한 과업을 해결하기 위해 기술(skill)을 유연하게 호출할 수 있지만, 이들의 장기적인 개선은 체계적인 기술 구축, 축적 및 전이의 부족으로 인해 근본적인 제약을 받습니다. 특히, 기술 통합(skill consolidation)을 위한 통일된 프레임워크가 없으면 에이전트는 서로 다른 과업에 걸쳐 유사한 능력을 중복해서 구축하는 경향이 있고, 경험을 재사용 가능한 자산으로 효과적으로 변환하지 못하며, 특정 과업에 특화된 기술을 새로운 시나리오로 일반화하는 데 어려움을 겪습니다. 이러한 한계를 해결하기 위해, 우리는 더 넓은 과업 일반화를 위해 기존의 기술 경험을 재사용하는 기술 통합 프레임워크인 SkillPyramid를 제안합니다. 계층적 기술 토폴로지(hierarchical skill topology) 상에서 작동하는 SkillPyramid는 에이전트가 과업 수행 중에 새로운 기술을 구성, 검증 및 통합할 수 있도록 하는 자가 진화(self-evolution) 메커니즘을 추가로 도입합니다. 네 가지 백본 모델(backbone models)을 사용하여 ALFWorld, WebShop, ScienceWorld에서 수행한 실험 결과, SkillPyramid는 평균 보상(average reward)을 38.0% 대폭 증가시키고 실행 단계(execution steps)를 27.7% 감소시켰습니다. 전반적으로, 우리의 방법은 기술 컬렉션을 정적인 리소스 풀에서 동적인 진화 시스템으로 변환합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기