AIP: 에이전트 기술 학습 및 제어를 위한 그래프 표현 방식
요약
에이전트 기술을 자유 형식의 산문 대신 유향 실행 그래프로 모델링하는 AIP(Agent Instruction Protocol)를 제안합니다. 이 방식은 에이전트의 행동을 결정론적 단계와 타입 지정된 엣지로 구조화하여 신뢰성을 높이고 개선을 용이하게 합니다.
핵심 포인트
- 자연어 대신 그래프 구조를 사용하여 에이전트 실행의 신뢰성 확보
- Claude Sonnet의 작업 보상 및 통과율 유의미한 상승 확인
- 스키마 검증 및 노드 단위 접근을 통한 정밀한 오류 진단 가능
- 기술 개선 프로세스를 산문 재작성에서 측정 가능한 튜닝 루프로 전환
오늘날 에이전트 기술(Agent Skills)은 주로 자유 형식의 산문(free-form prose)으로 구성되어 있어, 에이전트가 매 세션마다 어떻게 행동해야 하는지를 읽고, 해석하고, 다시 도출해야 하는 과정을 요구합니다. 이는 두 가지 복합적인 비용을 발생시킵니다. 첫째는 구현 중심의 작업에서 신뢰성이 저하되는 것이며, 둘째는 기술의 생성 및 개선의 어려움입니다. 산문을 편집하는 과정은 인간과 에이전트 모두에게 까다로운 취약한 프로세스이며, 특히 모델 학습에서 충분히 다뤄지지 않은 도메인 특화 절차적 지식(domain-specific procedural knowledge)의 경우 더욱 그렇습니다. 에이전트 지침 프로토콜(Agent Instruction Protocol, AIP)은 기술을 유향 실행 그래프(directed execution graph)로 모델링함으로써 이 두 가지 문제를 모두 해결합니다. 즉, 결정론적 스크립트(deterministic scripts) 또는 자연어 설명(natural-language descriptions)으로 뒷받침되는 이산적 단계(discrete steps)를 노드(nodes)로 하고, 명시적인 타입 지정 입력/출력 엣지(typed input/output edges)로 연결하며, 스키마 검증된 YAML 명세(schema-validated YAML specification)에 의해 제어되는 방식입니다. 컴파일러 메타 기술(compiler meta-skill)은 기존의 인간이 작성한 기술을 이러한 형태로 변환합니다. 이 방식의 이점은 두 가지입니다. 첫째, 인간이 작성한 기술을 AIP로 컴파일했을 때, SkillsBench의 27개 실제 에이전트 작업 전반에서 Claude Sonnet의 평균 작업 보상(mean task reward)이 0.60에서 0.71로, 통과율(pass rate)이 53%에서 67%로 상승했습니다. 이는 통계적으로 유의미한 이득(Wilcoxon signed-rank p = 0.011)이며, 13번의 무승부와 함께 12대 2의 승률을 기록했으며, 종종 실제 소요 시간(wall-clock time)도 더 적게 걸렸습니다. 그래프는 에이전트에게 자연어로부터 코드, 명령, 도구 호출을 다시 도출하도록 요구하는 대신, 검증되고 실행 가능한 단위(runnable units)를 제공합니다. 둘째, 생성 및 개선 측면에서 각 기술은 스키마 검증이 가능하고, 기능적으로 테스트 가능하며, 노드별로 접근할 수 있기 때문에 실패 원인을 정확하게 진단하고 수리할 수 있습니다. 작성된 두 가지 기술의 실패 사례는 스크립트 수준에서 추적되었습니다. AIP 명세를 조정하고 다시 컴파일한 결과, 두 사례 모두 회귀(regression) 없이 복구되었으며(한 작업은 0/5에서 5/5로 상승), 이를 통해 기술 개선을 산문 재작성이 아닌 측정 가능한 튜닝 루프(tuning loop)로 전환했습니다. 동일한 그래프 구조는 코퍼스 수준의 거버넌스(corpus-level governance)와 기술 내성(skill introspection)을 지원하며, 기술에 대한 강화학습(reinforcement learning)을 위한 자연스러운 행동 공간(action space)을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기