본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 19. 13:20

정답지(Ground-Truth) 없이 정량화 가능한 시각적 설명 학습하기

요약

정답지(Ground-Truth)가 부족한 상황에서 설명 가능한 인공지능(XAI)의 품질을 정량적으로 평가할 수 있는 새로운 프레임워크를 제안합니다. 이 프레임워크는 정보의 충분성과 필요성을 기반으로 하며, 이를 미분 가능한 근사치로 활용해 모델의 의사 결정 과정을 인과적으로 설명하는 어댑터 모듈을 학습시킬 수 있습니다.

핵심 포인트

  • 정답지 없이도 XAI 방법론의 품질을 정량화할 수 있는 새로운 지표 프레임워크 제안
  • 모델 의사 결정에 기여하는 정보의 충분성(sufficiency)과 필요성(necessity)을 공식적으로 고려
  • 지표의 미분 가능한 근사치를 감독 신호로 사용하여 블랙박스 모델용 인과적 설명 어댑터 학습 가능
  • 기존 XAI 기술 대비 인간의 직관과 더 일치하며 우수한 정량적 성능 입증

설명 가능한 인공지능 (Explainable AI (XAI)) 기술은 현대 딥러닝 (deep learning) 모델의 검증과 책임 있는 사용을 위해 점점 더 중요해지고 있지만, 비교할 수 있는 양질의 정답지 (ground-truth)가 부족하여 평가하기가 어렵습니다. 우리는 연속적인 입력 섭동 (continuous input perturbation)에 기반하여 XAI 방법론의 품질을 정량화할 수 있는 지표 역할을 하는 프레임워크를 제안합니다. 우리의 지표는 모델의 의사 결정에 기여한 정보의 충분성 (sufficiency)과 필요성 (necessity)을 공식적으로 고려하며, 기존 지표들보다 설명 품질에 대한 인간의 직관과 더 잘 일치하는 다양한 사례들을 보여줍니다. 이 지표의 특성을 활용하기 위해, 우리는 또한 새로운 XAI 방법을 제안하며, 이 지표의 미분 가능한 근사치 (differentiable approximation)를 감독 신호 (supervision signal)로 사용하여 모델을 미세 조정 (fine-tune)하는 사례를 고려합니다. 그 결과, 모델의 성능을 저하시키지 않으면서도 어떤 블랙박스 (black-box) 모델 위에서도 학습되어 모델의 의사 결정 과정에 대한 인과적 설명 (causal explanations)을 출력할 수 있는 어댑터 (adapter) 모듈을 얻을 수 있습니다. 우리는 이 방법으로 생성된 설명이 여러 정량적 지표에 따라 경쟁 XAI 기술들보다 우수한 성능을 보임을 입증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0