arXiv논문2026. 05. 29. 11:28

SAHG: 소셜 봇 탐지를 위한 섹터-비등방성 쌍곡선 그래프 모델

요약

LLM 기반 소셜 봇 탐지를 위해 섹터-비등방성 쌍곡선 그래프(SAHG) 모델을 제안합니다. 기존 유클리드 GNN의 한계를 극복하기 위해 방향 의존적 곡률을 학습하고, 이중 채널 설계를 통해 봇과 인간의 신호가 섞이는 문제를 해결합니다.

핵심 포인트

쌍곡선 기하학을 활용해 계층적 소셜 그래프의 왜곡 문제 해결
구조적 방향에 따라 기하학적 해상도를 조정하는 비등방성 곡률 학습
이중 채널 인코딩으로 오염된 이웃 집계로부터 계정 특징 보호
주요 벤치마크(Fox8-23 등)에서 기존 모델 대비 높은 성능 달성

LLM (Large Language Model) 기반의 소셜 봇은 유창하고 인간과 유사한 텍스트를 생성할 수 있어, 콘텐츠 기반 탐지만으로는 식별 우위를 점하기 어렵게 만듭니다. 그러나 조직적인 캠페인은 여전히 상호작용, 행동 유사성, 공유된 이웃, 커뮤니티 내 위치, 그리고 조직적 활동과 같은 관계적 패턴을 남기며, 이는 그래프 기반 방법론이 활용할 수 있는 요소입니다. 기존의 그래프 탐지기들은 이러한 증거를 활용할 때 두 가지 문제에 직면합니다. 첫째, 유클리드 GNN (Euclidean Graph Neural Networks)은 계층적이고 척도 없는 (scale-free) 소셜 그래프를 왜곡합니다. 쌍곡선 기하학 (hyperbolic geometry)이 이러한 부피 성장 불일치 (volume-growth mismatch) 문제를 해결할 수는 있지만, 고정 곡률 (fixed-curvature) 모델은 밀도와 분리 요구 사항이 서로 다른 구조적 방향에 대해 여전히 균일한 기하학적 해상도를 할당합니다. 둘째, 관계적 증거가 항상 신뢰할 수 있는 것은 아닙니다. 정교한 봇들은 실제 사용자와 이질적 연결 (heterophilic connections)을 형성하여, 이웃 집계 (neighborhood aggregation) 과정에서 봇과 인간의 신호가 섞이고 계정 수준의 증거가 희석되게 만듭니다. 우리는 이 두 가지 문제를 모두 해결하는 extsc{SAHG} (Sector-Anisotropic Hyperbolic Graph)를 제안합니다. extsc{SAHG}는 구조적 방향에 따라 기하학적 해상도를 조정하는 방향 의존적 곡률 필드 $γ(u)$를 학습하며, 섹터 프로토타입 (sector prototypes)을 사용하여 각도 집중도와 정렬을 분류기가 읽을 수 있는 특징으로 변환합니다. 오염된 집계가 계정 수준의 증거를 압도하는 것을 방지하기 위해, extsc{SAHG}는 계정별 특징과 그래프 이웃 표현을 두 개의 독립적인 SAH 채널에 인코딩하고, 오직 분류기 단계에서만 이들을 융합합니다. Fox8-23, BotSim-24, MGTAB에 대한 실험 결과, extsc{SAHG}는 세 가지 벤치마크 모두에서 가장 높은 정확도(accuracy)와 F1 점수를 달성하였으며, 특징 기반, 그래프 기반, LLM 기반 및 등방성 쌍곡선 (isotropic hyperbolic) 베이스라인 모델들을 능가했습니다. 어블레이션 (Ablation) 및 기하학적 분석을 통해 비등방성 기하학 (anisotropic geometry)과 이중 채널 설계의 효과를 확인했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

SAHG: 소셜 봇 탐지를 위한 섹터-비등방성 쌍곡선 그래프 모델

요약

핵심 포인트

댓글