arXiv논문2026. 05. 27. 12:19

ExTax: 설득, 감정, 서사 역할 분류 체계를 통한 설명 가능한 허위 정보 탐지

요약

ExTax는 설득적 수사, 감정 조작, 서사적 역할을 통합한 17차원 분류 체계를 통해 설명 가능한 허위 정보 탐지 프레임워크를 제안합니다. LLM의 불일치를 조정하고 멀티 헤드 어텐션을 활용하여 기존 모델보다 높은 성능과 장르 불균형에 대한 견고함을 입증했습니다.

핵심 포인트

설득, 감정, 서사 중심의 17차원 분류 체계 제안
엔트로피 기반 동적 라벨 평활화로 LLM 간 불일치 조정
이종 멀티 헤드 어텐션을 통한 문맥 인코딩 융합
기존 딥러닝 모델 대비 높은 성능 및 장르 불균형 견고함 확보

LLM (Large Language Models)의 민주화는 매우 유창한 허위 정보 (disinformation)의 생성과 유포를 가속화했으며, 이로 인해 전통적인 구문-의미론적 검증 (syntax-semantic verification) 방식은 점점 더 불충분해지고 있습니다. 이러한 기만 행위는 단순히 표면적인 허위 사실에만 의존하는 경우가 드뭅니다. 대신, 설득적인 수사 (persuasive rhetoric), 감정적 조작 (emotional manipulation), 그리고 서사적 역할 구축 (narrative role construction)을 결합하여 다양한 인지 경로를 통해 독자의 해석에 영향을 미치는 경우가 많습니다. 그러나 기존의 탐지기들은 구문, 외부 지식, 설득 또는 정서적 신호와 같이 고립된 신호들에만 주로 강조점을 두기 때문에, 허위 정보의 기저에 깔린 다면적인 조작 의도를 포착하거나 인간이 감사 가능한 (human-auditable) 설명을 제공하는 데 어려움을 겪습니다.

이러한 격차를 해소하기 위해, 본 논문에서는 설명 가능한 허위 정보 탐지를 위한 분류 체계 정렬 프레임워크인 \textbf{ExTax}를 제안합니다. ExTax는 설득적 수사, 감정적 조작, 서사적 역할을 17차원의 분류 공간 (taxonomic space)으로 통합하며, 여기에는 6가지 설득 수사 전략, 5가지 감정 조작 방법, 6가지 서사 역할 범주가 포함됩니다. 이 프레임워크는 여러 최첨단 LLM (frontier LLMs)으로부터 속성을 이끌어내고, 엔트로피 기반 동적 라벨 평활화 (Entropy-driven Dynamic Label Smoothing)를 통해 이들의 불일치를 조정하며, 결과적으로 생성된 분류 표현 (taxonomic representations)을 이종 멀티 헤드 어텐션 (Heterogeneous Multi-Head Attention)을 통해 문맥 인코딩 (contextual encodings)과 융합하여, 각 예측을 해석 가능한 조작 프로필 (manipulation profile)에 근거하게 합니다.

5개의 교차 도메인 및 교차 장르 벤치마크에서 ExTax는 전체 Macro $F_1$ 점수 $0.8456$을 달성하며, 최첨단 딥러닝 및 LLM 기반 베이스라인 모델들을 능가했습니다. 또한, 가장 강력한 딥러닝 베이스라인이 $0.9454$에서 $0.6194$로 성능이 저하되는 심각한 장르 불균형 상황에서도 견고함(robustness)을 유지합니다.

AI 자동 생성 콘텐츠

원문 바로가기

ExTax: 설득, 감정, 서사 역할 분류 체계를 통한 설명 가능한 허위 정보 탐지

요약

핵심 포인트

댓글