arXiv논문2026. 06. 09. 11:11

신뢰의 함정: 그래프 신경망 (GNN)을 위한 캘리브레이션 공격

요약

그래프 신경망(GNN)의 신뢰도 캘리브레이션 강건성을 분석하기 위한 새로운 공격 프레임워크인 UGCA를 제안합니다. 이 연구는 그래프의 이산적 특성과 에지 섭동 민감도 문제를 해결하며, 모델의 일반화 성능과 캘리브레이션 취약성 사이의 관계를 이론적으로 규명합니다.

핵심 포인트

GNN의 신뢰도 캘리브레이션을 겨냥한 UGCA 프레임워크 제안
KL-발산 및 재순위화 메커니즘을 통한 공격 효율성 증대
모델 일반화와 캘리브레이션 취약성 간의 상관관계 입증
정확도를 유지하면서 기대 캘리브레이션 오차(ECE)를 증가시킴

신뢰할 수 있는 의사결정 (trustworthy decision-making)을 위해 신뢰도 캘리브레이션 (confidence calibration)이 안전 필수 애플리케이션 (safety-critical applications)에서 필수적이지만, 적대적 구조적 섭동 (adversarial structural perturbations)에 대한 캘리브레이션된 GNN의 강건성 (robustness)은 여전히 미개척 분야로 남아 있습니다. 그러나 그래프에 대한 캘리브레이션 공격 (calibration attacks)을 연구하는 것은 독특한 기술적 과제들을 제시합니다: (1) 그래프 구조의 이산적 특성 (discrete nature)은 경사 기반 최적화 (gradient-based optimization)를 복잡하게 만들며, (2) 기존의 과소 신뢰 (underconfidence) 목적 함수는 예측을 균등 분포 (uniform distributions)로 유도하는 데 실패하고, (3) GNN은 에지 섭동 (edge perturbations)에 매우 민감하여 공격 제약 조건을 위반하는 의도치 않은 레이블 변경 (label changes)을 자주 유발합니다. 이러한 과제들을 해결하기 위해, 우리는 GNN 캘리브레이션 강건성의 최악의 경우 (worst-case, white-box) 분석을 위해 설계된 extbf{통합 그래프 캘리브레이션 공격 (Unified Graph Calibration Attack, UGCA)} 프레임워크를 제안합니다. UGCA는 균등한 예측 분포를 장려하기 위한 KL-발산 손실 (KL-divergence loss), 레이블 뒤집힘 (label flipping)을 줄이기 위한 재순위화 메커니즘 (reranking mechanism), 위반이 발생할 때 레이블을 복구하기 위한 하이브리드 손실 (hybrid loss), 그리고 더 넓은 적대적 탐색 공간을 탐색하기 위한 빔 서치 (beam search)를 도입합니다. 나아가 우리는 모델 일반화 (model generalization), 데이터셋 복잡도 (dataset complexity), 그리고 캘리브레이션 취약성 (calibration vulnerability)을 연결하는 이론적 통찰을 제공하며, 정확도가 더 높거나 더 많은 클래스를 가진 데이터셋에서 훈련된 모델이 이 위협 모델 하에서 더 취약함을 보여줍니다. 광범위한 실험을 통해 UGCA가 분류 정확도 (classification accuracy)를 유지하면서도 기대 캘리브레이션 오차 (Expected Calibration Error, ECE)를 실질적으로 증가시킨다는 것을 입증합니다. 우리의 코드는 https://github.com/CaptainCuong/Graph-Calibration-Attack.git 에서 공개적으로 사용할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

신뢰의 함정: 그래프 신경망 (GNN)을 위한 캘리브레이션 공격

요약

핵심 포인트

댓글