SAHG: 소셜 봇 탐지를 위한 섹터-비등방성 쌍곡선 그래프 모델
요약
LLM 기반 소셜 봇 탐지를 위해 섹터-비등방성 쌍곡선 그래프(SAHG) 모델을 제안합니다. 기존 유클리드 GNN의 한계를 극복하기 위해 방향 의존적 곡률을 학습하고, 이중 채널 설계를 통해 봇과 인간의 신호가 섞이는 문제를 해결합니다.
핵심 포인트
- 쌍곡선 기하학을 활용해 계층적 소셜 그래프의 왜곡 문제 해결
- 구조적 방향에 따라 기하학적 해상도를 조정하는 비등방성 곡률 학습
- 이중 채널 인코딩으로 오염된 이웃 집계로부터 계정 특징 보호
- 주요 벤치마크(Fox8-23 등)에서 기존 모델 대비 높은 성능 달성
LLM (Large Language Model) 기반의 소셜 봇은 유창하고 인간과 유사한 텍스트를 생성할 수 있어, 콘텐츠 기반 탐지만으로는 식별 우위를 점하기 어렵게 만듭니다. 그러나 조직적인 캠페인은 여전히 상호작용, 행동 유사성, 공유된 이웃, 커뮤니티 내 위치, 그리고 조직적 활동과 같은 관계적 패턴을 남기며, 이는 그래프 기반 방법론이 활용할 수 있는 요소입니다. 기존의 그래프 탐지기들은 이러한 증거를 활용할 때 두 가지 문제에 직면합니다. 첫째, 유클리드 GNN (Euclidean Graph Neural Networks)은 계층적이고 척도 없는 (scale-free) 소셜 그래프를 왜곡합니다. 쌍곡선 기하학 (hyperbolic geometry)이 이러한 부피 성장 불일치 (volume-growth mismatch) 문제를 해결할 수는 있지만, 고정 곡률 (fixed-curvature) 모델은 밀도와 분리 요구 사항이 서로 다른 구조적 방향에 대해 여전히 균일한 기하학적 해상도를 할당합니다. 둘째, 관계적 증거가 항상 신뢰할 수 있는 것은 아닙니다. 정교한 봇들은 실제 사용자와 이질적 연결 (heterophilic connections)을 형성하여, 이웃 집계 (neighborhood aggregation) 과정에서 봇과 인간의 신호가 섞이고 계정 수준의 증거가 희석되게 만듭니다. 우리는 이 두 가지 문제를 모두 해결하는 extsc{SAHG} (Sector-Anisotropic Hyperbolic Graph)를 제안합니다. extsc{SAHG}는 구조적 방향에 따라 기하학적 해상도를 조정하는 방향 의존적 곡률 필드 $γ(u)$를 학습하며, 섹터 프로토타입 (sector prototypes)을 사용하여 각도 집중도와 정렬을 분류기가 읽을 수 있는 특징으로 변환합니다. 오염된 집계가 계정 수준의 증거를 압도하는 것을 방지하기 위해, extsc{SAHG}는 계정별 특징과 그래프 이웃 표현을 두 개의 독립적인 SAH 채널에 인코딩하고, 오직 분류기 단계에서만 이들을 융합합니다. Fox8-23, BotSim-24, MGTAB에 대한 실험 결과, extsc{SAHG}는 세 가지 벤치마크 모두에서 가장 높은 정확도(accuracy)와 F1 점수를 달성하였으며, 특징 기반, 그래프 기반, LLM 기반 및 등방성 쌍곡선 (isotropic hyperbolic) 베이스라인 모델들을 능가했습니다. 어블레이션 (Ablation) 및 기하학적 분석을 통해 비등방성 기하학 (anisotropic geometry)과 이중 채널 설계의 효과를 확인했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기