arXiv논문2026. 05. 22. 11:28

Shapley 및 Banzhaf 상호작용의 프록시 기반 근사 (Proxy-Based Approximation of Shapley and

요약

고차 상호작용을 포착하는 Shapley 및 Banzhaf 지수의 효율적인 추정을 위해 ProxySHAP을 제안합니다. 트리 기반 프록시 모델과 잔차 보정 전략을 결합하여 속도와 정확도 문제를 동시에 해결했습니다.

핵심 포인트

트리 앙상블에 대한 다항 시간 일반화 도출
지수적인 트리 깊이 의존성 문제 해결
잔차 조정 전략을 통한 프록시 편향 보정
대규모 피처 환경에서 SOTA 성능 입증

Shapley 및 Banzhaf 상호작용 (interactions)은 현대 머신러닝 (machine learning) 애플리케이션에 내재된 복잡한 역학을 포착합니다. 그러나 이러한 고차 상호작용 (higher-order interactions)에 대한 현재의 추정기 (estimators)들은 속도와 정확도 사이에서 절충(trade-off)을 해야 합니다. 이러한 한계를 극복하기 위해, 우리는 ProxySHAP을 소개합니다. ProxySHAP은 트리 기반 프록시 모델 (tree-based proxy models)의 높은 샘플 효율성 (sample efficiency)과 잔차 보정 (residual correction)을 통한 일관성 (consistency)으로 향하는 원칙적인 경로를 조화시킵니다. 이론적 수준에서, 우리는 트리 앙상블 (tree ensembles)에 대한 정확한 상호작용 지수 (interaction indices)를 계산하기 위해 개입적 TreeSHAP (interventional TreeSHAP)의 다항 시간 일반화 (polynomial-time generalization)를 도출하였으며, 이를 통해 이전 방법들의 지수적인 트리 깊이 의존성 (exponential tree-depth dependencies)을 성공적으로 우회했습니다. 또한, 우리는 잔차 조정 전략 (residual adjustment strategy)을 공식적으로 분석하여, 최대 샘플 재사용 (Maximum Sample Reuse, MSR)이 상호작용 크기에 따라 분산이 지수적으로 증가하지 않으면서 프록시 편향 (proxy bias)을 보정하는 구체적인 조건을 규명했습니다. 광범위한 벤치마킹을 통해 ProxySHAP이 수천 개의 피처 (features)를 가진 대규모 애플리케이션을 포함하여 근사 품질 (approximation quality)에 대한 새로운 SOTA (state-of-the-art) 표준을 세웠음을 입증했습니다. 소규모 및 대규모 예산 (budget) 체제 모두에서 가장 낮은 오차를 달성함으로써, ProxySHAP은 이전의 최상위 추정기인 ProxySPEX 및 KernelSHAP-IQ를 크게 능가하는 동시에, 다운스트림 설명 가능성 (downstream explainability) 작업에서도 우수한 성능을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

Shapley 및 Banzhaf 상호작용의 프록시 기반 근사 (Proxy-Based Approximation of Shapley and

요약

핵심 포인트

댓글