Diffusion Integrated Gradients: 유연한 특징 기여도 산출을 위한 제어 가능한 경로 생성
요약
기존 Integrated Gradients(IG)의 고정된 경로 문제를 해결하기 위해 확산 모델을 활용한 DiffIG 방법론을 제안합니다. DiffIG는 경로 생성을 조건부 생성 모델링 문제로 재정의하여, 사용자 가이드에 따라 제어 가능한 고품질의 특징 기여도를 산출합니다.
핵심 포인트
- 기존 IG의 고정된 경로로 인한 노이즈 및 왜곡 문제 해결
- 확산 모델을 이용한 경로 생성의 조건부 생성 모델링 접근
- 가이드 샘플링을 통한 추론 시 제어 가능한 설명 생성 가능
- 기존 방식 대비 정량적 성능 향상 및 지각적 정렬 달성
Integrated Gradients (IG)와 같은 경로 기반 기여도 산출 (Path-based attribution) 방법들은 베이스라인(baseline)에서 입력값까지의 경로를 따라 그래디언트 (gradient)를 적분함으로써, 모델의 예측을 입력 특징 (input features)에 할당하는 강력한 공리적 특성과 효과성 덕분에 널리 채택되고 있습니다. 그러나 기여도 산출 경로의 선택은 설명의 품질에 큰 영향을 미치며, 기존 방식들은 고정되거나 수작업으로 설계된 경로에 의존하기 때문에 종종 노이즈가 섞이거나 왜곡된 기여도를 생성합니다. 이러한 한계를 해결하기 위해, 본 논문에서는 경로 생성을 조건부 생성 모델링 (conditional generative modeling) 문제로 재정의하는 새로운 방법론인 Diffusion Integrated Gradients (DiffIG)를 제안합니다. DiffIG는 먼저 Stick-Breaking Process로부터 생성된 경로들에 대한 분포를 학습하도록 확산 모델 (diffusion model)을 훈련시킨 다음, 샘플링 과정 중에 사용자 가이드를 삽입하기 위해 가이드 샘플링 (guided sampling)을 사용합니다. 우리는 DiffIG가 기존의 경로 기반 방법들과 정량적으로 일치하거나 이를 능가하며, 지각적으로 정렬된 (perceptually aligned) 설명을 달성함을 입증합니다. 본 연구는 유연하고 추론 시 제어가 가능한 설명 가능한 인공지능 (Explainable Artificial Intelligence, XAI) 방법을 위한 새로운 생성적 관점을 제시합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기