노드-이웃 간 의미론적 일관성: TAG 이상 탐지를 위한 텍스트-위상 정렬
요약
텍스트 속성 그래프(TAG)에서 노드와 이웃 간의 의미론적 불일치를 탐지하는 N2NSC 프레임워크를 제안합니다. LLM과 그래프 위상 정보를 결합하여 텍스트 의미론과 구조적 관계 사이의 대응 관계를 효과적으로 포착합니다.
핵심 포인트
- 노드와 이웃 간의 의미론적 일관성을 활용한 이상 탐지 방식 제안
- LLM의 의미론적 이해와 GNN의 구조적 패턴 포착 능력 결합
- 텍스트 의미론과 그래프 위상 간의 대응 관계를 포착하는 두 가지 융합 경로 도입
- 8개 데이터셋 실험을 통해 기존 SOTA 모델 대비 성능 우위 입증
텍스트 속성 그래프 (Text-Attributed Graphs, TAGs)에서의 그래프 이상 탐지 (Graph Anomaly Detection, GAD)는 사기 탐지 및 학술적 무결성 검증과 같은 응용 분야에서 매우 중요합니다. 기존의 접근 방식은 일반적으로 두 가지 패러다임으로 나뉩니다. GNN (Graph Neural Network) 기반 방법은 구조적 패턴을 효과적으로 포착하지만, 미세한 텍스트 의미론 (Textual Semantics)을 포착하는 데 어려움을 겪습니다. LLM (Large Language Model)을 그래프와 통합하는 방법은 의미론적 이해를 개선하지만, 이웃 노드들 사이의 위상 관계 (Topological Relationships)를 완전히 이해하지 못합니다. 더욱이, 두 패러다임 모두 텍스트 의미론과 그래프 위상 관계 사이의 대응 관계를 간과하며, 이로 인해 의미론이 이웃과 일치하지 않는 노드를 식별하는 능력이 제한됩니다. 본 논문에서 우리는 TAG 이상 탐지를 노드-이웃 간 의미론적 일관성 (Node-to-Neighborhood Semantic Consistency) 문제로 공식화하며, 여기서 이상치는 노드와 그 이웃 사이의 텍스트 의미론적 불일치 또는 위상적 편차(Topological Deviation)로부터 발생할 수 있습니다. 우리는 두 가지 상호 보완적인 융합 경로를 통해 그래프 위상과 텍스트 의미론 사이의 대응 관계를 포착하는 프레임워크인 N2NSC (Node-to-Neighborhood Semantic Consistency)를 제안합니다. 이 두 경로는 시너지 효과를 내며, LLM이 이상 탐지를 위해 텍스트 및 구조적 이웃 정보를 모두 충분히 활용할 수 있도록 합니다. 8개의 데이터셋에 걸친 광범위한 실험을 통해 N2NSC가 현재의 최첨단 (State-of-the-art) 방법들을 지속적으로 능가함을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기