MUSE-Autoskill: 기술 생성, 메모리, 관리 및 평가를 통한 자기 진화형 에이전트
요약
MUSE-Autoskill은 LLM 에이전트가 기술을 생성, 메모리 저장, 관리, 평가 및 개선하는 통합 라이프사이클을 제안하는 프레임워크입니다. 기술을 정적인 산물이 아닌 지속적으로 진화하는 자산으로 취급하여 작업 성공률과 재사용성을 높입니다.
핵심 포인트
- 기술 생성부터 평가까지 통합된 라이프사이클 제공
- 기술 수준의 메모리(skill-level memory) 도입으로 경험 축적
- 유닛 테스트와 런타임 피드백을 통한 지속적 기술 개선
- 작업 성공률, 효율성 및 에이전트 간 전이 능력 향상
대규모 언어 모델 (LLM) 에이전트는 복잡한 작업을 해결하기 위해 재사용 가능한 기술 (skills)에 의존합니다. 그러나 기존의 기술 생성 방식은 기술을 고립되고 정적인 산물로 취급하여, 재사용성, 신뢰성 및 장기적인 개선을 제한합니다. 우리는 통합된 라이프사이클 (생성, 메모리, 관리, 평가 및 개선) 하에서 에이전트가 기술을 생성, 재사용 및 정제함으로써 작업 해결 능력을 지속적으로 향상시킬 수 있도록 하는 기술 중심 에이전트 프레임워크인 MUSE-Autoskill 에이전트 (Memory-Utilizing Skill Evolution)를 제안합니다. 우리의 프레임워크는 에이전트가 필요에 따라 기술을 생성하고, 여러 작업에 걸쳐 이를 저장 및 재사용하며, 효율적으로 조직 및 선택하고, 유닛 테스트 (unit tests)와 런타임 피드백 (runtime feedback)을 통해 지속적인 개선을 위한 평가를 수행할 수 있도록 합니다. 나아가 우리는 각 기술에 대한 경험을 작업 전반에 걸쳐 축적하는 기술 수준의 메모리 (skill-level memory)를 도입하여, 시간이 지남에 따라 더욱 효과적인 재사용과 적응을 가능하게 합니다. SkillsBench에서의 실험은 라이프사이클이 관리되는 기술이 작업 성공률, 효율성, 재사용성 및 에이전트 간 전이 (cross-agent transfer)를 향상시킬 수 있다는 초기 증거를 제공하며, 기술을 수명이 길고, 경험을 인지하며, 테스트 가능한 자산으로 취급하는 것의 중요성을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기