arXiv논문2026. 06. 03. 12:15

정보 공개를 위한 분포 경로 기반의 기여도 산출 (Attribution via Distributional Paths for

요약

입력 공간 대신 구조화된 탐침 분포 공간을 활용하여 모델의 기여도를 산출하는 Reveal-IG 방법론을 제안합니다. 이 방식은 기존 경로 기반 방법론의 한계를 극복하여 완전성을 유지하면서도 다중 스케일 이미지 및 정형 데이터에 대해 안정적인 기여도를 제공합니다.

핵심 포인트

입력 공간 대신 구조화된 탐침 분포 경로를 활용
모델의 기대 출력 변화에 대한 완전성 유지
다중 스케일 이미지 및 정형 데이터 불확실성 수용
기존 경로 방법론의 아티팩트 방지 및 안정적 성능

기여도 산출 (Feature attribution) 방법론은 입력 특징 (input features)에 중요도 점수를 할당함으로써 예측을 설명합니다. Integrated Gradients와 같은 경로 기반 (Path-based) 방법론은 extit{완전성 (completeness)}을 만족하기 때문에 특히 매력적입니다. 여기서 완전성이란 기여도의 합이 기준 상태 (reference state)와 입력 사이의 모델 출력 변화량과 일치함을 의미합니다. 그러나 대부분의 경로 방법론은 이 궤적 (trajectory)을 입력 공간 (input space)에서 정의하며, 선택된 경로를 따라 점 단위로 섭동 (perturbed)된 입력을 통해 모델을 설명합니다. 입력 공간 경로는 모델이 통과하는 각 지점에서의 가공되지 않은 응답 (raw response)을 적분하지만, 특징이 조회되는 해상도 (resolution)를 제어할 수 없습니다. 즉, 궤적의 초기 단계이자 베이스라인에 인접한 부분이 입력 자체와 동일한 비중으로 설명에 기여하게 됩니다.

본 논문에서는 경로 기여도 산출을 입력 공간에서 관심 예시 주변의 구조화된 탐침 분포 (structured probe distributions) 공간으로 격상시키며, 우리의 방법론을 Reveal-IG라고 명명합니다. Reveal-IG는 가공되지 않은 입력 값을 가로지르는 대신, 입력에 대한 정보를 점진적으로 드러내며 이러한 분포 경로 (distributional path)를 따라 모델의 기대 출력 (expected output) 변화를 기여도로 산출합니다. 그 결과, 모델의 기대 응답에 대해 완전성을 유지하면서도, 다중 스케일 이미지 탐침 (multiscale image probes) 및 정형 데이터 (tabular data)의 특징별 불확실성 (feature-wise uncertainty)을 자연스럽게 수용하는 경로 기여도 산출 프레임워크를 구축하였습니다. 합성 진단 (Synthetic diagnostics) 결과, Reveal-IG는 입력 공간 방법론에 영향을 미치는 경로 아티팩트 (path artifacts)를 방지함을 보여주었습니다. 또한 ImageNet 분류 및 정형 데이터 회귀 (tabular regression) 전반에 걸쳐 안정적이고 부호가 있는 기여도 (signed attributions)를 생성하며, 기여도 부호를 사용하는 지표에서 앞서나가는 동시에 나머지 지표에서도 경쟁력 있는 성능을 유지합니다.

AI 자동 생성 콘텐츠

원문 바로가기

정보 공개를 위한 분포 경로 기반의 기여도 산출 (Attribution via Distributional Paths for

요약

핵심 포인트

댓글