arXiv논문2026. 06. 10. 11:11

XtrAIn: 특징 속성 부여(Feature Attribution)를 위한 학습 가이드형 폐쇄(Training-Guided Occlusion)

요약

XtrAIn은 기존 폐쇄 기반 속성 부여 방식의 편향과 불안정성을 해결하기 위해 제안된 학습 가이드형 방법론입니다. 입력 공간 대신 파라미터 공간의 업데이트를 측정하여 특징 중요도를 추정하며, 더 깨끗하고 해석 가능한 속성 패턴을 제공합니다.

핵심 포인트

기존 폐쇄 방식의 분포 외(OOD) 샘플 및 속성 이동 문제 해결
모델의 학습 궤적을 활용한 파라미터 공간 기반 속성 부여
계산 효율을 위한 경량 근사 방식 Xstep 제안
타겟 클래스 정렬을 위한 XtrAIn+ 변형 모델 소개
이미지 및 의료 데이터셋에서 높은 해석 가능성 입증

폐쇄 기반 속성 부여(Occlusion-based attribution) 방법은 입력 특징(feature)을 섭동(perturbing)시키고 그에 따른 모델 출력의 변화를 측정함으로써 특징 중요도를 추정하는 직관적인 방법을 제공합니다. 그러나 이러한 방법의 신뢰성은 특징 제거가 어떻게 구현되는지에 따라 크게 영향을 받습니다. 외부에서 선택된 베이스라인(baselines)은 편향(bias), 분포 외(out-of-distribution) 샘플, 그리고 불안정한 설명을 유발할 수 있으며, 비선형 모델(nonlinear models)에서는 특정 특징 집합의 폐쇄(occlusion)가 폐쇄되지 않은 다른 특징들의 기여도까지 변화시킬 수 있습니다. 우리는 비폐쇄 특징들의 속성 점수(attribution scores)가 초기 값에서 벗어나는 이 현상을 속성 이동(attribution shift)이라고 부릅니다.

설명을 불안정하게 만드는 이러한 주요 문제들에 도전하기 위해, 우리는 폐쇄 연산을 입력 공간(input space)에서 파라미터 공간(parameter space)으로 전이하는 학습 가이드형 속성 부여 방법인 XtrAIn을 소개합니다. XtrAIn은 입력 값을 수동으로 제작된 베이스라인으로 교체하는 대신, 모델의 학습 궤적(training trajectory)을 따르며 특징과 연관된 파라미터 업데이트가 출력 로짓(output logits)에 어떻게 영향을 미치는지 측정합니다. 우리는 더 나아가 계산 비용을 줄이기 위한 경량 근사 방식인 Xstep과, 타겟 클래스(target class)와 정렬된 업데이트를 강조하는 타겟 집중형 변형인 XtrAIn+를 소개합니다.

통제된 이미지 데이터셋과 PAM50 유방암 아형 분류(breast-cancer subtype classification)에 대한 실험 결과, 제안된 방법들이 표준 속성 부여 베이스라인보다 더 깨끗하고 해석 가능한 속성 패턴을 생성함을 보여줍니다. 전반적으로 XtrAIn은 특징 속성 부여에 대한 학습 인지적(training-aware) 관점을 제공하며, 학습 과정 동안 특징 수준의 증거가 어떻게 형성되는지 연구하기 위한 유용한 진단 도구를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

XtrAIn: 특징 속성 부여(Feature Attribution)를 위한 학습 가이드형 폐쇄(Training-Guided Occlusion)

요약

핵심 포인트

댓글