arXiv논문2026. 06. 09. 12:06

SAILS: 국소 효과 평활화(Local Effect Smooths)를 통한 대리 모델 기반 상호작용 분석

요약

SAILS는 블랙박스 모델의 특성 상호작용을 분석하기 위해 GAM 대리 모델을 활용하는 새로운 프레임워크를 제안합니다. 이 방식은 상호작용의 탐지를 넘어 선형, 곱 분리형 등 구체적인 기능적 형태를 분류하고 시각화할 수 있습니다.

핵심 포인트

GAM 대리 모델을 통한 모델 불가지론적 상호작용 분석
상호작용의 유형을 선형 및 곱 분리형 등으로 자동 분류
미분 수준에서 상호작용 구성 요소를 분리하여 정밀 분석
XAI 도구로서 상호작용의 기능적 형태 규명 가능

특성 상호작용(Feature interactions)은 머신러닝 모델 예측력의 상당 부분을 주도하지만, 기존의 설명 방법들은 상호작용의 기능적 형태(functional form)를 밝히지 못한 채 상호작용을 탐지하고 정량화하는 데 그치거나, 제한된 유형의 상호작용만을 시각화합니다. 우리는 블랙박스 모델의 국소 효과(local effects)에 적합된 해석 가능한 일반화 가법 모델 (GAM, Generalized Additive Model) 대리 모델을 통해 쌍별 상호작용(pairwise interactions)을 분석하는 모델 불가지론적 (model-agnostic) 프레임워크인 SAILS (Surrogate-based Analysis of Interactions via Local effect Smooths)를 제안합니다. 관심 특성의 각 구간에 대해, 대리 모델의 평활 항(smooth terms)은 미분 수준에서 상호작용 구성 요소를 분리하며, 이를 통해 (i) 평활 항에 대한 유의성 검정에서 유도된 휴리스틱을 통한 상호작용 탐지, (ii) 선형(linear), 곱 분리형(product-separable), 비곱 분리형(non-product-separable) 유형으로의 상호작용 형태 분류, (iii) 각 상호작용 유형에 맞춤화된 해석 가능한 시각화를 가능하게 합니다. 우리는 통제된 시뮬레이션과 실제 과업을 통해 이 프레임워크를 경험적으로 검증하였으며, 쌍별 상호작용에 대한 효과를 입증하는 동시에 강한 특성 상관관계 및 고차 상호작용 (higher-order interactions) 하에서의 한계를 보여주었습니다. SAILS는 상호작용의 탐지를 넘어 그 기능적 형태를 규명함으로써 XAI (Explainable AI) 도구 상자의 주목할 만한 공백을 메웁니다.

AI 자동 생성 콘텐츠

원문 바로가기

SAILS: 국소 효과 평활화(Local Effect Smooths)를 통한 대리 모델 기반 상호작용 분석

요약

핵심 포인트

댓글