본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 30. 12:14

이질적 그래프(Heterophilic Graphs)에서의 비지도 커뮤니티 탐지를 위한 곡률 가이드 셰프 확산(Curvature-Guided

요약

이질적 그래프(Heterophilic Graphs)에서 비지도 방식으로 커뮤니티를 탐지하는 새로운 알고리즘인 CGSD를 제안합니다. Forman-Ricci 곡률을 활용하여 엔드투엔드 파이프라인을 구축하며, 기존 비지도 베이스라인 대비 우수한 성능을 입증했습니다.

핵심 포인트

  • Forman-Ricci 곡률을 단일 위상 신호로 활용한 CGSD 알고리즘 제안
  • 곡률 게이트 셰프 확산 인코더와 곡률 인식 스펙트럴 클러스터러(CSpec) 도입
  • Wisconsin, Chameleon 등 5개 벤치마크에서 기존 모델 대비 경쟁력 확보
  • 클러스터러 단계에서의 곡률 재가중을 통해 NMI 성능 개선

연결된 노드들이 종종 서로 다른 클래스에 속하는 이질적 그래프(heterophilic graphs)에서 커뮤니티를 탐지하는 것은 비지도 방식(unsupervised methods)에게 매우 어려운 과제입니다. 전통적인 모듈성(modularity) 및 스펙트럴 방식(spectral methods)은 특징(feature)에 무관하며, 딥 그래프 클러스터링(deep graph-clustering) 방식은 불투명한 대조 학습(contrastive) 또는 생성(generative) 메커니즘에 의존합니다. 우리는 각 에지의 이산 Forman-Ricci 곡률(discrete Forman-Ricci curvature)을 단일 위상 신호(topological signal)로 사용하여 엔드투엔드(end-to-end) 파이프라인의 모든 단계에 전파하는 완전 비지도 커뮤니티 탐지 알고리즘인 곡률 가이드 셰프 확산(Curvature-Guided Sheaf Diffusion, CGSD)을 제안합니다. CGSD는 세 가지 구체적인 기여를 합니다: (i) 에지 메시지를 $σ(κ_e)$로 게이팅(gating)하고 세 가지 레이블 프리(label-free) 구조적 손실(모듈성(modularity), 안티-콜랩스(anti-collapse), 곡률 가중 재구성(curvature-weighted reconstruction))로부터 학습되는 곡률 게이트 셰프 확산 인코더(curvature-gated sheaf-diffusion encoder); (ii) Ng-Jordan-Weiss 알고리즘 적용 전 임베딩의 $k$-NN 친밀도(affinity)를 $σ(ακ_{e^*})$로 재가중하는 곡률 인식 스펙트럴 클러스터러(curvature-aware spectral clusterer, CSpec); (iii) 9개의 진정한 비지도 베이스라인(unsupervised baselines)에 대한 통합된 레이블 프리 평가입니다. 5개의 이질적 벤치마크(Cora, Cornell, Texas, Wisconsin, Chameleon)에서 CGSD는 Wisconsin과 Chameleon에서 압도적인 성과를 거두었으며, 나머지 3개에서도 9개의 비지도 베이스라인과 비교하여 경쟁력 있는 성능을 보였습니다. 가장 강력한 베이스라인 대비 성능 향상은 인코더가 아닌 클러스터러(clusterer)에 의해 주도됩니다. 동일한 임베딩에서 CSpec은 평균 NMI를 $K$-Means의 $0.091$에서 $0.107$로 개선했습니다 ($+15%$, 대응 표본 $t$-검정 $p=0.008$). 이 메커니즘은 해석 가능합니다: 커뮤니티 내부 및 커뮤니티 간의 곡률 분포가 시각적으로 분리됩니다. 코드는 https://github.com/woodywff/cgsd 에서 오픈 소스로 공개되어 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0