설명 알고리즘을 현실 세계와 연결하기 위한 설명 카드(Explanation Cards)의 필요성
요약
기존 알고리즘 설명 방식의 한계를 극복하기 위해 '설명 카드(Explanation Cards)' 개념을 제안합니다. 설명의 강건성과 타당성에 대한 보완 정보를 제공하여 사용자가 설명을 올바르게 해석할 수 있도록 돕는 프레임워크를 다룹니다.
핵심 포인트
- 기존 알고리즘 설명의 직관성 부족 및 정보 불일치 문제 지적
- 설명 알고리즘의 강건성과 타당성을 보완하는 '설명 카드' 제안
- 해석의 책임을 사용자에서 제공자로 전환하는 가이드라인 포함
- SHAP 및 반사실적 설명을 통한 실질적 구현 방법 입증
- EU AI Act의 설명 가능성 규정을 준수하기 위한 실무적 수단 제시
알고리즘 설명(Algorithmic explanations)은 이해관계자들이 불투명한 알고리즘 결정 과정을 이해하도록 돕기 위해 의도되었으나, 실제로는 기대에 미치지 못하는 경우가 많습니다. 첫째, 알고리즘 설명의 의미가 직관적으로 예상되는 것과 다른 경우가 많아, 이를 올바르게 해석하기 위해서는 전문가의 지식이 필요합니다. 둘째, 최근 연구에 따르면 대중적인 설명 알고리즘들이 복잡한 결정 함수(decision functions)의 동작에 대해 유익한 정보를 제공하지 못한다는 것이 밝혀졌습니다. 이러한 문제들이 결합되어, 설명이 전달하는 것처럼 보이는 내용과 실제로 제공하는 내용 사이에 간극을 만듭니다. 본 연구에서는 설명 알고리즘을 위한 '설명 카드(Explanation Cards for Explanation Algorithms)'를 제안합니다. 이는 표준적인 설명에 강건성(robustness) 및 타당성(validity)에 관한 보완적인 정보와 해석을 위한 명확한 지침을 추가하여 기능을 강화합니다. 이러한 보완 정보는 그렇지 않으면 유익하지 않았을 설명을 실질적으로 유용하게 만들 수 있으며, 동시에 설명이 유용하지 않은 사례를 탐지하는 데에도 도움을 줄 수 있습니다. 중요한 점은, 설명 카드에 포함된 해석 지침이 책임을 사용자에서 제공자(providers)로 전환한다는 것입니다. 사용자가 설명으로부터 무엇을 결론지을 수 있고 없는지를 스스로 인식하기를 기대하는 대신, 제공자가 이를 사전에 명시적으로 밝혀야 합니다. 반사실적 설명(counterfactual explanations)과 SHAP을 예시로 사용하여, 제공자가 어떻게 설명 카드를 구성할 수 있는지, 그리고 이 카드가 사용자에게 건전한 해석에 필요한 가이드를 어떻게 제공하는지 입증합니다. 나아가 우리는 설명 카드가 EU AI Act의 설명 가능성(explainability) 규정을 실행에 옮길 수 있는 실질적인 수단을 제공한다고 주장합니다. 종합적으로, 설명 카드는 설명 알고리즘을 현실 세계의 사용 사례에 적합하게 만드는 중요한 단계입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기