정보 공개를 위한 분포 경로 기반의 기여도 산출 (Attribution via Distributional Paths for
요약
입력 공간 대신 구조화된 탐침 분포 공간을 활용하여 모델의 기여도를 산출하는 Reveal-IG 방법론을 제안합니다. 이 방식은 기존 경로 기반 방법론의 한계를 극복하여 완전성을 유지하면서도 다중 스케일 이미지 및 정형 데이터에 대해 안정적인 기여도를 제공합니다.
핵심 포인트
- 입력 공간 대신 구조화된 탐침 분포 경로를 활용
- 모델의 기대 출력 변화에 대한 완전성 유지
- 다중 스케일 이미지 및 정형 데이터 불확실성 수용
- 기존 경로 방법론의 아티팩트 방지 및 안정적 성능
기여도 산출 (Feature attribution) 방법론은 입력 특징 (input features)에 중요도 점수를 할당함으로써 예측을 설명합니다. Integrated Gradients와 같은 경로 기반 (Path-based) 방법론은 extit{완전성 (completeness)}을 만족하기 때문에 특히 매력적입니다. 여기서 완전성이란 기여도의 합이 기준 상태 (reference state)와 입력 사이의 모델 출력 변화량과 일치함을 의미합니다. 그러나 대부분의 경로 방법론은 이 궤적 (trajectory)을 입력 공간 (input space)에서 정의하며, 선택된 경로를 따라 점 단위로 섭동 (perturbed)된 입력을 통해 모델을 설명합니다. 입력 공간 경로는 모델이 통과하는 각 지점에서의 가공되지 않은 응답 (raw response)을 적분하지만, 특징이 조회되는 해상도 (resolution)를 제어할 수 없습니다. 즉, 궤적의 초기 단계이자 베이스라인에 인접한 부분이 입력 자체와 동일한 비중으로 설명에 기여하게 됩니다.
본 논문에서는 경로 기여도 산출을 입력 공간에서 관심 예시 주변의 구조화된 탐침 분포 (structured probe distributions) 공간으로 격상시키며, 우리의 방법론을 Reveal-IG라고 명명합니다. Reveal-IG는 가공되지 않은 입력 값을 가로지르는 대신, 입력에 대한 정보를 점진적으로 드러내며 이러한 분포 경로 (distributional path)를 따라 모델의 기대 출력 (expected output) 변화를 기여도로 산출합니다. 그 결과, 모델의 기대 응답에 대해 완전성을 유지하면서도, 다중 스케일 이미지 탐침 (multiscale image probes) 및 정형 데이터 (tabular data)의 특징별 불확실성 (feature-wise uncertainty)을 자연스럽게 수용하는 경로 기여도 산출 프레임워크를 구축하였습니다. 합성 진단 (Synthetic diagnostics) 결과, Reveal-IG는 입력 공간 방법론에 영향을 미치는 경로 아티팩트 (path artifacts)를 방지함을 보여주었습니다. 또한 ImageNet 분류 및 정형 데이터 회귀 (tabular regression) 전반에 걸쳐 안정적이고 부호가 있는 기여도 (signed attributions)를 생성하며, 기여도 부호를 사용하는 지표에서 앞서나가는 동시에 나머지 지표에서도 경쟁력 있는 성능을 유지합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기