arXiv논문2026. 06. 15. 03:48

그래프 신경망과 자기 학습을 이용한 노드 속성 네트워크 클러스터링

요약

본 연구는 그래프 신경망(GNN)을 활용하여 노드 속성 정보를 통합한 새로운 그래프 클러스터링 프레임워크를 제안합니다. 이 프레임워크는 완전히 비지도 학습 환경에서 자기 학습 라운드를 통해 작동하며, 매 라운드마다 GNN이 노드 표현을 생성하고 이를 기반으로 클러스터링을 수행합니다.

핵심 포인트

GNN과 노드 속성을 결합한 새로운 그래프 클러스터링 프레임워크 제안
자기 학습(self-learning) 라운드를 통해 네트워크와 속성 정보를 통합적으로 활용
단일 훈련보다 다중 라운드 학습이 성능 향상에 기여함을 입증
네트워크 간선과 노드 속성을 모두 고려할 때 최첨단 수준의 성능을 보임

그래프 클러스터링(Graph clustering)은 그래프의 노드 집합을 분리된 부분집합으로 나누어 어떤 잠재적 정보를 반영하는 문제로, 수많은 다양한 시나리오에서 응용되는 근본적인 문제입니다. 이 고전적인 문제는 수십 년 동안 여러 커뮤니티에 의해 다루어져 왔지만, 최근 실제 데이터에 의해 주도되는 변형은 노드가 속성(attributes)을 가지고 있으며 이 속성이 또한 정보적이라는 시나리오를 고려합니다. 이는 네트워크 정보(간선, edges)와 노드 정보(속성, attributed)를 동시에 활용하는 새로운 클러스터링 알고리즘 설계로 이어졌습니다. 본 연구는 그래프 신경망(GNN)을 그래프 클러스터링에 적용한 이전 연구들을 기반으로 하는 새로운 프레임워크를 제안합니다. 제안된 프레임워크는 완전히 비지도 학습 환경에서 자기 학습(self learning)의 라운드를 통해 작동합니다. 각 라운드마다 GNN이 노드의 표현(representations)을 생성하고, 이 표현을 사용하여 노드들을 클러스터링합니다. 이러한 클러스터링은 다음 라운드에서 노드 표현을 생성하는 데 사용되는 그래프에 영향을 미칩니다. 더욱이, 매 라운드마다 원래의 그래프를 사용하여 구축된 컨텍스트 그래프(context graph)가 노드 표현을 생성하는 데 사용됩니다. 실험 결과는 제안된 방법론이 합성 데이터에서 네트워크 간선과 노드 속성 모두로부터 정보를 추출하며, 어느 한쪽도 매우 정보적이지 않을 때 오직 네트워크나 속성에만 초점을 맞춘 알고리즘보다 우수한 성능을 보임을 보여줍니다. 여러 라운드의 학습은 또한 성능을 향상시키며, 항상 긴 단일 훈련(즉, 고전적인 GNN 그래프 클러스터링)보다 우수합니다. 실제 데이터셋을 고려할 때, 실험 결과는 제안된 방법론이 클러스터 크기가 균형 잡혀 있을 경우 최첨단(state-of-the-art) 방법들과 경쟁력이 있음을 나타냅니다.

AI 자동 생성 콘텐츠

원문 바로가기

그래프 신경망과 자기 학습을 이용한 노드 속성 네트워크 클러스터링

요약

핵심 포인트

댓글