LLM 에이전트를 위한 가설 기반 기술 최적화 (Hypothesis-Driven Skill Optimization)
요약
LLM 에이전트의 외부 기술(External skills)을 안전하고 효과적으로 업데이트하기 위한 가설 기반 기술 최적화(HDSO) 프레임워크를 제안합니다. 학습이 필요 없는(train-free) 방식으로, 검증 가능한 가설을 통해 유용한 기술만을 선별하여 에이전트의 성능을 향상시킵니다.
핵심 포인트
- 가설 기반의 검증 과정을 통해 노이즈가 섞인 기술 증류 위험을 방지함
- 학습이 필요 없는(train-free) 프레임워크로 동결된 모델에서도 작동 가능
- ALFWorld 환경에서 Qwen 모델의 성공률을 유의미하게 향상시킴
- 피드백 반전이 발생하는 노이즈 상황에서도 안정적인 성능 유지
- 감사 가능한(auditable) 기술 수명 주기를 제공하여 신뢰성 확보
외부 기술(External skills)은 모델 가중치를 변경하지 않고도 행동 중심의 LLM 에이전트를 개선할 수 있지만, 희소하거나 노이즈가 있는 궤적(trajectories)으로부터 기술을 증류(distill)할 경우 지속적인 기술 업데이트는 위험할 수 있습니다. 타당한 성찰(reflection)이라 할지라도 유용한 절차, 가짜 지름길(spurious shortcut), 또는 대상 실행기(executor)가 안정적으로 따를 수 없는 규칙을 인코딩할 수 있기 때문입니다. 우리는 기술 큐레이터(skill curator)와 에이전트 실행기(agent executor)가 모두 동결된 추론 엔드포인트(inference endpoints)인 학습이 필요 없는(train-free) 프레임워크인 가설 기반 기술 최적화 (Hypothesis-Driven Skill Optimization, HDSO)를 제안합니다. 큐레이터는 실행기 추적(executor traces)을 관찰하고, 명시적인 검증 계획을 포함한 검증 가능한 가설을 제안하며, 해당 가설을 후보 기술 패키지로 인스턴스화합니다. 이후 대조/처치(control/treatment) 실행 쌍을 통해 패키지를 검증하고, 행동 차이를 검토하며, 지원되는 후보만을 승인된 저장소(approved repository)로 통합합니다. 실행기는 점진적 공개(progressive disclosure)를 통해 승인된 기술을 소비하며, 기술이 선택되지 않을 때는 실행기 전용 경로(executor-only path)를 유지합니다. ALFWorld 환경에서 HDSO는 Qwen3-8B의 경우 실행기 전용 베이스라인 대비 평균 성공률(Avg. SR)을 +6.9포인트, Qwen3.6-27B의 경우 +4.0포인트를 향상시켰습니다. 기술 발견 및 검증 과정에서 20%의 무작위 성공/실패 피드백 반전(flipped feedback)이 발생하는 상황에서도 HDSO는 Qwen3-8B에 대해 +7.1포인트의 이득을 유지합니다. 전이(Transfer) 및 이종 쌍(heterogeneous-pair) 진단 결과, 검증된 저장소는 이를 생성한 실행 과정을 넘어 유용하게 사용될 수 있음을 보여주었으나, 교차 모델 큐레이션(cross-model curation)은 큐레이터의 진단, 실행기의 능력, 그리고 검증 증거가 일치할 때만 성공합니다. HDSO는 제약 없는 메모리 축적 절차 대신, 동결된 행동 에이전트를 위한 감사 가능한(auditable) 기술 수명 주기를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기