SkillRAE: 검색 증강 실행을 위한 에이전트 스킬 기반 컨텍스트 컴파일
요약
SkillRAE은 대규모 언어 모델(LLM) 기반 에이전트의 검색 증강 실행(RAE)을 개선하기 위해 제안된 2단계 접근 방식입니다. 이 방법은 스킬 라이브러리에서 선택된 여러 스킬과 지식 조각들을 단순히 모으는 것을 넘어, 이를 압축적이고 근거가 명확하며 즉시 사용 가능한 형태로 '컨텍스트 컴파일'하는 데 중점을 둡니다. SkillRAE는 오프라인 단계에서 다단계 스킬 그래프를 구축하고, 온라인 검색 및 구조 복구 인지 압축 컴파일을 통해 최종적으로 작업에 최적화된 고품질 컨텍스트를 생성하여 기존 RAE 방법론 대비 성능 향상을 입증했습니다.
핵심 포인트
- SkillRAE은 LLM 에이전트의 재사용 가능한 스킬 라이브러리 활용 능력을 강화하는 2단계 RAE 프레임워크입니다.
- 기존 연구가 스킬 검색과 실행 최적화에 집중했다면, SkillRAE은 선택된 증거를 '압축적이고 근거가 명확한' 작업별 컨텍스트로 컴파일하는 과정에 초점을 맞춥니다.
- 오프라인 단계에서는 다단계 스킬 그래프(multi-level skill graph)를 구축하여 스킬 간의 복잡한 관계를 포착합니다.
- 온라인 검색 단계에서 '구조 복구 인지 압축 컴파일(rescue-aware compact compilation)'을 적용하여 핵심 증거를 효과적으로 추출하고 컨텍스트를 최적화합니다.
- 실험 결과, SkillRAE는 SkillsBench와 같은 벤치마크에서 기존 SOTA 방법 대비 상당한 성능 향상을 보여주었습니다.
대규모 언어 모델(LLM) 기반 에이전트(예: OpenClaw)는 문서 중심 워크플로우나 데이터 집약적 분석과 같은 아티팩트가 풍부한 작업을 해결하기 위해 재사용 가능한 스킬 라이브러리에 점점 더 의존하고 있습니다. 이러한 라이브러리가 커짐에 따라, 몇몇 연구들은 검색 증강 실행(Retrieval-Augmented Execution, RAE)을 연구하려고 시도했습니다. RAE는 종종 먼저 외부 스킬과 다른 지식을 검색한 다음, 검색된 스킬을 사용하여 컨텍스트를 컴파일하고, 마지막으로 작업을 실행하는 과정을 거칩니다. 기존 연구들은 주로 스킬 검색과 작업 실행 최적화에 중점을 두었으며, 다운스트림 실행기(executors)가 작업을 완료하기 위해 압축적이고, 근거가 명확하며, 즉시 사용 가능한 형태로 선택된 스킬 증거를 효과적으로 구성하는 방법에 대해서는 거의 주의를 기울이지 않았습니다. 이러한 격차를 해소하기 위해, 우리는 스킬 기반 컨텍스트 컴파일에 초점을 맞춘 2단계 RAE 접근 방식인 SkillRAE를 제안합니다. 이는 오프라인 단계와 온라인 단계로 구성됩니다. 구체적으로, 오프라인 인덱싱 단계에서는 스킬 커뮤니티, 스킬 및 재사용 가능한 서브유닛 위에 다단계 스킬 그래프(multi-level skill graph)를 구축하여 그 관계를 포착합니다. 온라인 검색 단계에서는 먼저 그래프 내에서 선택된 서브유닛 증거 내보내기(selected-subunit evidence export)를 통해 스킬 순위 검색을 수행하고, 이어서 구조 복구 인지 압축 컴파일(rescue-aware compact compilation)을 적용하여 핵심 증거를 복구합니다. 이러한 구성 요소들이 결합되어 거친 순위의 스킬 세트를 압축적이고, 근거가 명확하며, 즉시 사용 가능한 작업별 컨텍스트로 컴파일합니다.
두 개의 공개 벤치마크에서 수행된 실험은 SkillRAE가 RAE에 대해 기준선(baselines) 대비 상당한 개선을 달성함을 보여줍니다. 예를 들어, SkillsBench에서는 SOTA 방법보다 11.7%의 향상을 기록했습니다. 추가적인 제거 연구(Ablation studies)는 우리의 컨텍스트 컴파일이 단순한 프롬프트 추가가 아니라 매우 중요함을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기