arXiv논문2026. 05. 28. 12:38

해석 가능하도록 설계된 그래프 신경망(Graph Neural Networks)을 위한 일반화된 Tikhonov 레이어

요약

해석 가능성을 설계 단계부터 반영한 새로운 그래프 신경망(GNN) 레이어인 Tikhonov 레이어를 제안합니다. 이 레이어는 학습된 파라미터를 통해 노드 특징과 그래프 토폴로지의 기여도를 직접적으로 드러내며, 오버스무딩 문제를 완화하면서도 높은 성능을 유지합니다.

핵심 포인트

학습된 파라미터를 통해 예측 근거를 직접 확인 가능한 해석 가능성 제공
노드 중요도와 다항식 형태를 통해 데이터 충실도와 토폴로지 의존도 분석 가능
전역 수용장을 제공하여 오버스무딩 및 오버스쿼싱 현상 완화
기존 불투명한 모델들과 대등하거나 더 뛰어난 벤치마크 성능 입증

우리는 설계 단계부터 해석 가능하도록 만들어진 그래프 신경망 (Graph Neural Network) 레이어인 Tikhonov 레이어를 제안합니다. 이 레이어는 학습이 완료되면, 학습된 파라미터를 통해 어떤 노드 특징 (node features)과 그래프 토폴로지 (graph topology)의 어떤 측면이 예측에 활용되었는지 직접적으로 드러냅니다. 실제로 이 레이어의 전파 행렬 (propagation matrix)은 폐형 (closed-form) $R = (p(L)+Q)^{-1} Q$를 따릅니다. 여기서 $L$은 정규화된 그래프 라플라시안 (normalized graph Laplacian)이며, $Q = diag(q_1,...,q_n)$은 양수의 노드 중요도 점수 (node-importance scores)를 가진 학습 가능한 대각 행렬 (diagonal matrix)이고, $p(\cdot)$은 학습 가능한 다항식 (polynomial)입니다. 임의의 입력 특징 $x$에 대해, 레이어 출력 $Rx$는 노드 수준의 데이터 충실도 (data fidelity)와 토폴로지 기반의 정규화 페널티 (regularization penalty) 사이의 균형을 맞추는 일반화된 그래프 Tikhonov 문제의 정확한 최소화 값 (minimizer)입니다. 학습된 쌍 ${{q_i},p}$은 내장된 설명 (built-in explanation)을 구성합니다. 즉, 큰 $q_i$는 노드 $i$ 자체의 특징이 예측을 주도함을 나타내고, 작은 $q_i$는 국소적 그래프 토폴로지에 대한 의존성을 신호하며, $p$의 형태는 동질성 (homophily), 이질성 (heterophily), 또는 대역 통과 응답 (band-pass response) 중 무엇이 활용되는지를 드러냅니다. 표현력 (Expressivity)은 중요도 점수를 생성하는 전용의 임의로 깊은 Q-네트워크 (Q-network)를 통해 복잡성을 라우팅함으로써 유지되는 동시에, Tikhonov 레이어 자체는 투명성을 유지합니다. 우리는 서로 다른 노드 중요도 행렬이 서로 다른 전파 연산자 (propagation operators)를 생성함을 증명하여, 설명을 계산과 구조적으로 결합합니다. 또한, Tikhonov 레이어는 단일 레이어 내에서 전역 수용장 (global receptive field)을 제공하여 오버스무딩 (oversmoothing)과 오버스쿼싱 (oversquashing)을 모두 완화합니다. 표준 그래프 분류 벤치마크에 대한 실험을 통해, 이 모델이 해석 가능하고 충실한 설명을 생성하는 동시에 불투명한 베이스라인 (baselines) 모델들과 대등하거나 때로는 더 나은 성능을 보임을 확인했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

해석 가능하도록 설계된 그래프 신경망(Graph Neural Networks)을 위한 일반화된 Tikhonov 레이어

요약

핵심 포인트

댓글