TRACE: 운영적 중요 분야에서 신뢰할 수 있는 에이전트 AI 시스템에 대한 계량학적 기반 공학 프레임워크
요약
본 기술 기사는 운영적으로 중요한 분야를 위한 '신뢰할 수 있는 에이전트 AI' 개발을 목표로 하는 교차 도메인 공학 프레임워크인 TRACE를 소개합니다. TRACE는 네 가지 레이어의 참조 아키텍처, 고전 ML과 LLM 검증기 분리(L2a/L2b), 상태 기반 오케스트레이션 및 에스컬레이션 정책을 포함합니다. 특히 GUM/VIM/ISO 17025에 매핑된 계량적 신뢰 지표와 계산적 간결성 비율(CPR)이라는 새로운 설계 원칙을 도입하여, AI 시스템의 신뢰성과 투명성을 공학적으로 확보하는 방법을 제시합니다.
핵심 포인트
- TRACE는 운영적으로 중요한 도메인에 특화된 '신뢰할 수 있는 에이전트 AI'를 위한 포괄적인 공학 프레임워크입니다.
- 프레임워크는 네 가지 계층 구조의 참조 아키텍처와 상태 기반 오케스트레이션 및 에스컬레이션 정책을 포함합니다.
- LLM 사용을 기본값이 아닌 의도된 설계 결정으로 간주하며, 고전 ML과 LLM 검증기를 분리(L2a/L2b)하는 구조를 제안합니다.
- GUM/VIM/ISO 17025와 같은 국제 표준에 기반한 계량적 신뢰 지표 세트를 활용하여 AI의 신뢰성을 정량화합니다.
- 새로운 설계 원칙인 '계산적 간결성 비율(CPR)'을 도입하여 모델의 복잡성과 효율성을 공학적으로 관리할 수 있게 합니다.
우리는 운영적 중요 (operationally critical) 도메인에서 신뢰할 수 있는 에이전트 AI(Trustworthy Agentic AI)를 위한 교차 도메인 공학 프레임워크인 TRACE 를 소개합니다. TRACE 는 네 가지 레이어의 참조 아키텍처와 명시적인 고전 머신러닝 (classical-ML) vs. LLM-validator 분리 (L2a/L2b), 상태 기반 오케스트레이션 및 에스컬레이션 정책 (L3), 제한된 인간 감독 (bounded human supervision) (L4), GUM/VIM/ISO 17025 에 매핑된 계량학적 기반 신뢰 지표 세트, 그리고 계산적 간결성 비율 (Computational Parsimony Ratio, CPR) 으로 정량화되는 모델 간결성 원리 (Model-Parsimony principle) 를 결합합니다. 임상 의사결정 지원, 산업 다도메인 운영, 사법 AI 어시스턴트라는 세 가지 인스턴테이션은 원칙적으로 다른 거버넌스 컨텍스트를 통해 동일한 아키텍처와 지표를 전이합니다. L2a/L2b 분리는 대형 언어 모델 사용이 아키텍처의 기본값이 아닌 의도된 설계 결정임을, CPR 를 통해 간결성을 정량화함으로써 만듭니다. TRACE 는 신뢰할 수 있는 AI 공학에서 CPR 을 1 차원 설계 원칙으로 도입합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기