본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 19. 12:05

LedgerAgent: 정책 준수 도구 호출 에이전트를 위한 구조화된 상태 (Structured State)

요약

LedgerAgent는 도구 호출 에이전트가 작업 상태를 명시적인 장부(ledger)로 관리하여 정책 준수 능력을 높이는 방법론입니다. 프롬프트에 의존하는 암시적 상태 관리의 한계를 극복하고, 도구 호출 전 정책 위반을 사전에 차단합니다.

핵심 포인트

  • 상태 관리를 암시적 방식에서 명시적 장부(ledger) 방식으로 전환
  • 도구 호출 전 상태 의존적 정책 제약 조건을 확인하여 위반 차단
  • 표준 프롬프트 방식 대비 pass^k 지표 및 다중 시도 일관성 향상
  • 오픈 웨이트 및 클로즈드 웨이트 모델 모두에서 효과 입증

고객 서비스 도메인에서의 정책 준수 도구 호출 에이전트 (Policy-adherent tool-calling agents)는 도구를 호출하고 도메인 정책을 준수하는 동안 턴(turn) 전반에 걸쳐 작업 상태 (task states)를 유지해야 합니다. 작업 상태는 사용자 상호작용과 도구 호출을 통해 관찰된 관련 사실, 식별자, 제약 조건 및 조건들로 구성됩니다. 표준 에이전트에서는 작업 상태가 별도로 표현되지 않습니다. 관찰 내용, 도구 반환 값, 정책 지침이 프롬프트 (prompt)에 배치되며, 에이전트는 다음 행동을 결정할 때마다 프롬프트로부터 관련 상태를 매번 재구성해야 합니다. 이러한 설계는 상태 관리를 암시적 (implicit)으로 만들어 두 가지 일반적인 실패 모드를 생성합니다. 에이전트가 올바른 사실을 검색하더라도 나중에 오래되거나, 누락되었거나, 잘못된 정보에 근거하여 결정을 내릴 수 있으며, 구문적으로 유효한 도구 호출이라 할지라도 현재 작업 상태에 의존하는 도메인 정책을 위반할 수 있습니다. 우리는 관찰된 작업 상태를 별도의 장부 (ledger)에 유지하고 해당 상태를 프롬프트에 렌더링하는 도구 호출 에이전트를 위한 추론 시간 (inference-time) 방법론인 \textsc{LedgerAgent}를 소개합니다. 이 장부는 환경을 변화시키는 도구 호출이 실행되기 전에 상태 의존적 정책 제약 조건을 확인하는 데에도 사용되어, 정책 위반을 차단합니다. 4개의 고객 서비스 도메인과 오픈 웨이트 (open-weight) 및 클로즈드 웨이트 (closed-weight) 모델이 혼합된 패널을 대상으로 실험한 결과, \textsc{LedgerAgent}는 표준 프롬프트 기반 도구 호출 방식보다 평균 pass\textasciicircum{}k를 향상시켰으며, 특히 더 엄격한 다중 시도 일관성 (multi-trial consistency) 지표에서 가장 큰 이득을 보였습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0