본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 20. 10:55

TERGAD: 그래프 이상 탐지를 위한 구조 인식 텍스트 강화 표현

요약

TERGAD는 그래프 이상 탐지(GAD) 시 노드의 구조적 문맥과 텍스트 특징 간의 불일치를 해결하기 위해 제안된 새로운 데이터 증강 프레임워크입니다. LLM을 활용하여 노드의 위상적 속성을 자연어 서사로 변환하고, 이를 게이트형 이중 분기 오토인코더를 통해 기존 노드 속성과 융합하여 고차원적인 의미론적 임베딩을 생성합니다. 실험 결과, TERGAD는 6개의 실제 데이터셋에서 기존 최신 모델들을 능가하는 성능을 보여주었습니다.

핵심 포인트

  • 노드의 위상적 속성을 자연어 서사로 변환하여 LLM의 의미론적 추론 능력을 활용함
  • 게이트형 이중 분기 오토인코더를 통해 구조적 의미론과 원래의 노드 속성을 적응적으로 융합
  • 재구성 오차를 기반으로 관찰된 속성과 LLM 기반 의미론적 기대치 사이의 편차를 포착하여 이상 점수 계산
  • 6개의 실제 데이터셋 실험을 통해 기존 SOTA 모델 대비 우수한 성능 입증

그래프 이상 탐지 (Graph Anomaly Detection, GAD)는 대다수와 크게 다른 노드 (nodes), 엣지 (edges), 또는 하위 구조 (substructures)와 같은 비정형 그래프 엔티티를 식별하는 것을 목표로 합니다. 기존의 텍스트가 풍부한 접근 방식들은 일반적으로 원시 텍스트 특징 (raw textual features)을 사용하여 데이터 표현 파이프라인에 구조적 문맥을 통합하지만, 노드의 구조적 문맥을 간과하는 경우가 많습니다. 이러한 한계는 노드의 고유한 콘텐츠와 위상적 역할 (topological role) 사이의 불일치로 인해 발생하는 정교한 이상 징후를 탐지하는 능력을 저해합니다. 이 격차를 해소하기 위해, 우리는 대규모 언어 모델 (Large Language Models, LLMs)의 의미론적 추론 능력을 통해 GAD를 위한 구조적 의미론을 풍부하게 하는 새로운 데이터 증강 프레임워크인 TERGAD (Structure-aware Text-enhanced Representations for Graph Anomaly Detection)를 제안합니다. 구체적으로, TERGAD는 노드 수준의 위상적 속성을 기술적인 자연어 서사로 변환하며, 이는 이후 LLM에 의해 처리되어 고차원 의미론적 임베딩 (semantic embeddings)을 도출합니다. 이러한 임베딩은 게이트형 이중 분기 오토인코더 (gated dual-branch autoencoder)를 통해 원래의 노드 속성과 적응적으로 융합되어 그래프 구조와 노드 특징을 공동으로 재구성합니다. 이상 점수 (anomaly score)는 통합된 재구성 오차 (reconstruction error)를 기반으로 계산되며, 관찰 가능한 속성과 LLM 기반의 의미론적 기대치 모두에서의 편차를 효과적으로 포착합니다. 6개의 실제 데이터셋에 대한 광범위한 실험을 통해 TERGAD가 최신 베이스라인 (state-of-the-art baselines) 모델들을 일관되게 능가함을 입증했습니다. 또한, 우리의 절제 연구 (ablation studies)는 구조적 의미론적 가이드의 필수적인 역할과 게이트형 융합 메커니즘의 효능을 검증합니다. 코드는 https://github.com/Kantorakitty/TERGAD-main 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0