명시적 불확실성 및 증거 충돌 모델링을 통한 감사 위험 평가용 멀티 에이전트 프레임워크
요약
UMAR는 MD&A, 재무 비율, CAM 에이전트를 활용하여 감사 위험을 평가하는 멀티 에이전트 프레임워크입니다. Dempster-Shafer 이론을 통해 에이전트 간 증거 충돌과 불확실성을 정량화하여 기존 모델보다 높은 예측 성능과 해석력을 제공합니다.
핵심 포인트
- 세 가지 특화된 에이전트를 통한 다각적 위험 분석
- Dempster-Shafer 이론 기반의 불확실성 및 증거 충돌 통합
- 기존 LLM 및 머신러닝 모델 대비 높은 AUROC 및 낮은 ECE 달성
- 재무 재작성 위험에 대한 실행 가능하고 해석 가능한 신호 제공
감사 위험 평가 (Audit risk assessment)는 이질적인 증거 소스들을 결합함으로써 점점 더 많은 이득을 얻고 있지만, 기존의 접근 방식들은 서로 다른 증거 스트림이 얼마나 잘 일치하는지를 정량화하지 못한 채 일반적으로 점 예측 (point predictions)만을 생성합니다. 우리는 MD&A 텍스트 에이전트 (MD&A Text Agent), 재무 비율 에이전트 (Financial Ratio Agent), 그리고 CAM 에이전트 (CAM Agent)라는 세 가지 특화된 에이전트를 사용하는 프레임워크인 UMAR (Uncertainty-Aware Multi-Agent Risk Assessment)를 제안합니다. 각 에이전트는 보정된 불확실성 추정치 (calibrated uncertainty estimates)와 함께 독립적인 위험 점수를 생성합니다. Dempster-Shafer 증거 이론 (Dempster-Shafer evidence theory)에 기반한 불확실성 통합기 (Uncertainty Aggregator)는 에이전트 간의 충돌을 명시적으로 측정하면서 이러한 점수들을 융합합니다. 우리는 재무 재작성 (financial restatement)을 타겟 레이블로 하여, SEC 10-K 보고서(2019-2023)에서 추출한 3,200개의 기업-연도 관측치로 구성된 미국 데이터셋에서 UMAR를 평가합니다. 실험 결과, UMAR는 AUROC 0.782와 PR-AUC 0.341을 달성하며 로지스틱 회귀 (logistic regression), XGBoost, FinBERT, 그리고 단일 에이전트 및 이중 에이전트 LLM 베이스라인 모델들을 능가했습니다. UMAR는 모든 방법론 중 가장 낮은 기대 보정 오차 (ECE = 0.052)를 달성하였으며, 실제 재작성 위험과 상관관계가 있는 증거 충돌 패턴을 식별함으로써 감사인들에게 잠재적으로 실행 가능하고 해석 가능한 위험 신호를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기