SkillsInjector: LLM 에이전트를 위한 동적 기술 컨텍스트 구축
요약
LLM 에이전트의 성능을 높이기 위해 기술 라이브러리를 동적으로 구성하는 SkillsInjector를 제안합니다. 컨텍스트 플래너와 세트 인식 렌더러를 통해 작업에 최적화된 기술 개수와 제시 방식을 결정하여 에이전트의 작업 완료율을 향상시킵니다.
핵심 포인트
- 정적인 기술 주입 방식의 한계 극복
- 실행 기반 기술 선호도 학습 및 적응형 예산 책정
- 이웃 기술과의 관계를 고려한 맞춤형 렌더링 제공
- 주요 벤치마크(tau2-bench 등)에서 성능 대폭 향상
LLM 에이전트(LLM agents)는 이제 복잡한 작업을 처리하기 위해 점점 커지는 기술 라이브러리(skill libraries)를 활용합니다. 그러나 더 많은 기술을 주입하는 것이 항상 작업 완료율을 높이는 것은 아니며, 심지어 성능을 저하시킬 수도 있습니다. 기존 방법들은 여전히 기술 주입(skill injection)을 고정된 기준으로 기술을 선택하고, 예산을 미리 정하며, 설명을 변경하지 않는 정적인 단계로 취급합니다. 우리는 어떤 기술이 노출되는지, 얼마나 많은 기술이 포함되는지, 그리고 기술이 어떻게 제시되는지가 모두 다운스트림 성능(downstream performance)에 영향을 미치기 때문에, 이러한 정적인 처리가 기술의 유용성을 저해할 수 있다고 주장합니다. 우리는 이러한 결정들을 공동으로 해결하는 2단계 적응형 방법인 SkillsInjector를 제안합니다. 첫째, 컨텍스트 플래너(context planner)는 실행에 기반한 기술 선호도(execution-grounded skill preferences)를 학습하고 각 작업에 대해 적응형 기술 개수를 허용합니다. 그다음 세트 인식 렌더러(set-aware renderer)는 선택된 설명들이 함께 주입된 이웃 기술들과의 관계에 따라 어떻게 제시될지를 맞춤화합니다. tau2-bench, SkillsBench, 그리고 ALFWorld에 걸쳐 SkillsInjector는 가장 높은 점수를 달성하였으며, 가장 강력한 베이스라인(baseline)보다 각각 3.9, 6.1, 7.3 퍼센트 포인트 향상된 성능을 보였습니다. 절제 연구(Ablation studies)를 통해 기술 선택, 적응형 예산 책정(adaptive budgeting), 그리고 세트 인식 렌더링(set-aware rendering)이 각각 성능 향상에 기여함을 확인했습니다. 이러한 결과는 기술이 증강된 에이전트(skill-augmented agents)가 주입된 컨텍스트 자체를 최적화함으로써 이득을 얻는다는 것을 보여줍니다. 코드는 출판 시 공개될 예정입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기