arXiv논문2026. 05. 29. 10:50

GRASP: 자기 개선형 LLM 에이전트를 위한 게이트형 회귀 인식 기술 제안자

요약

LLM 에이전트의 자기 개선 과정에서 발생하는 성능 퇴보 문제를 해결하기 위한 GRASP 기술을 제안합니다. 엄격한 회귀 예산과 수용 게이트를 통해 새로운 기술이 기존 성능을 해치지 않을 때만 라이브러리에 추가하는 방식입니다.

핵심 포인트

GRASP는 회귀 방지를 위해 엄격한 회귀 예산을 적용함
임상 벤치마크에서 gpt-oss-120b의 성능을 40.6%에서 88.8%로 대폭 향상
단순 기술 작성이 아닌 비교 제안과 수용 게이트가 핵심 성능 요인임
강력한 모델의 기술을 약한 모델로 전이할 때 성능 향상이 나타나는 비대칭성 확인

구조화된 환경에서 작동하는 LLM 에이전트(LLM agents)는 대화적인 방식이 아닌 운영적인 방식에서 실패하며, 신뢰성은 환경에 대한 절차적 지식(procedural knowledge)에 달려 있습니다. 기존의 자기 개선(self-improvement) 방법들은 각 새로운 항목이 이전에 올바르게 수행되었던 동작을 보존하는지 확인하지 않고 자연어 가이드를 축적하기 때문에, 하나의 궤적(trajectory)을 수정하는 메모가 다른 궤적을 조용히 퇴보(regress)시킬 수 있습니다. 우리는 에이전트의 개선을 제한된 기술 라이브러리(skill library)에 대한 일련의 편집 과정으로 취급하는 GRASP (Gated Regression-Aware Skill Proposer)를 소개합니다. 이 방식은 엄격한 회귀 예산(hard regression budget) 하에서 균형 잡힌 홀드아웃 프로브(held-out probe)에 대해 순 개선(net improvement)을 생성하는 경우에만 각 후보를 수용합니다. 우리는 두 가지 FHIR 기반 임상 벤치마크에서 다섯 가지 기본 모델(gpt-oss-120b, DeepSeek V4 Flash, Gemini 3.1 Flash Lite, GPT-4.1, GPT-5.4)을 대상으로 GRASP를 평가했습니다. MedAgentBench에서 GRASP는 gpt-oss-120b를 40.6%에서 88.8%로 끌어올렸으며, 다섯 가지 자기 개선 베이스라인 중 가장 강력한 모델보다 21.0포인트 앞섰고, 다른 모든 기본 모델을 17.2에서 40.3포인트까지 개선했습니다. 절제 연구(Ablations) 결과, 이러한 이득은 기술 작성 그 자체보다는 비교 제안 생성(comparative proposal generation), 수용 게이트(acceptance gate), 그리고 엄격한 회귀 예산 덕분인 것으로 나타났습니다. 검증이 없는 기술 작성은 기술을 사용하지 않는 것보다 나을 것이 없습니다. 이 메커니즘은 임상 도메인을 넘어 일반화되며, 4개의 비임상 환경 중 3개에서 에이전트를 개선하였고, 행동 공간(action space)이 개방형인 경우에만 성능이 정체되었습니다. 고정된 라이브러리(Frozen libraries)는 모델 간에 전이될 수 있는데, 더 강력한 모델의 기술은 약한 실행기(executors)가 스스로 학습하는 것 이상으로 성능을 향상시키는 반면 그 반대는 성립하지 않는 비대칭성을 보였으며, 이는 게이트가 없는(ungated) 어떤 베이스라인도 재현하지 못하는 특성입니다.

AI 자동 생성 콘텐츠

원문 바로가기

GRASP: 자기 개선형 LLM 에이전트를 위한 게이트형 회귀 인식 기술 제안자

요약

핵심 포인트

댓글