arXiv논문2026. 06. 04. 12:04

자기 성찰적 API (Self-Reflective APIs): AI 에이전트 복구를 위해 구조화된 정보가 장황한 설명보다 효과적이다

요약

AI 에이전트가 API 호출 오류 시 스스로 수정할 수 있도록 구조화된 피드백을 제공하는 '자기 성찰적 API' 개념을 제안합니다. 실험 결과 Anthropic 모델에서 작업 완료율과 토큰 효율성이 크게 향상됨을 확인했습니다.

핵심 포인트

구조화된 피드백이 장황한 설명보다 에이전트 복구에 효과적임
Anthropic 모델에서 작업 완료율 최대 40%p 향상
성공당 토큰 효율성 1.8~2.2배 개선
답변 유출(answer leakage) 감사를 위한 CI 인프라 제공

AI 에이전트가 API를 호출하다가 유효성 검사 오류 (validation error)를 마주했을 때, 에이전트에게는 무엇이 잘못되었는지 이상의 정보, 즉 다음에 무엇을 해야 하는지에 대한 정보가 필요합니다. 자기 성찰적 API (Self-reflective API)는 유효성 검사 실패 시, 에이전트가 외부 추론 없이도 요청을 수정하고 재시도할 수 있을 만큼 충분한, 기계 판독이 가능한 recovery_feedback.suggestions[] 페이로드를 반환합니다. 유출 감사 (leak-audited) 파일럿 테스트 (셀당 $N{=}30$, 3개의 LLM, 10개의 적대적 작업) 결과, Anthropic 모델에서 구조화된 제안 (structured suggestions)은 일반적인 영어 진단 (plain-English diagnoses)보다 작업 완료율을 $+36.7$--$40.0$pp 향상시켰으며 (Fisher의 정확 검정 $p ext{ } \le 0.0022$), 성공당 토큰 효율성 (token efficiency)은 $1.8$--$2.2 imes$ 더 우수했습니다. gpt-4o-mini에서는 이러한 향상이 유의미하지 않았습니다 ($p{=}0.435$). 결제 API (billing API)를 대상으로 한 두 번째 도메인 복제 실험에서도 이 패턴이 확인되었습니다. 이 비교는 LLM 벤치마크에서 문서화되지 않은 두 가지 유형의 답변 유출 (answer leakage)을 감사한 후에야 유효했습니다. 우리는 재사용 가능한 CI 인프라로서 audit_prompt_leakage.py를 배포합니다. 코드 및 데이터: https://github.com/arquicanedo/self-reflective-apis.

AI 자동 생성 콘텐츠

원문 바로가기

자기 성찰적 API (Self-Reflective APIs): AI 에이전트 복구를 위해 구조화된 정보가 장황한 설명보다 효과적이다

요약

핵심 포인트

댓글