Latent Causal Void: 오정보 탐지를 위한 명시적 누락 맥락 재구성

자동 오정보 탐지 (Automatic misinformation detection)는 기사가 명시적으로 기술하는 내용에서 기만이 드러날 때 성능이 좋습니다. 그러나 일부 오정보 기사들은 국소적으로는 일관성을 유지하며, 기사가 생략한 배경 사실을 제공하는 동시대 보고서들과 비교될 때에만 오도하는 성격을 띠게 됩니다. 우리는 이러한 누락 관련 설정 (omission-relevant setting)을 연구하며, 현재의 누락 인지 접근 방식 (omission-aware approaches)들이 일반적으로 검색된 맥락을 보조 증거로 첨부하거나 범주형 누락 신호를 추론할 뿐, 구체적인 누락 사실은 암시적인 상태로 남겨둔다는 점을 관찰했습니다. 우리는 각 대상 문장에 대해 누락된 사실을 명시적으로 재구성하고, 이를 그래프 추론 (graph reasoning)에서의 텍스트 기반 교차 출처 관계 (textual cross-source relation)로 사용하는 검색 가이드형 탐지기인 extit{Latent Causal Void} (LCV)를 제안합니다. 구체적으로, LCV는 시간적으로 정렬된 맥락 기사들을 검색하고, 동결된 지시어 튜닝된 대규모 언어 모델 (instruction-tuned large language model)에게 각 문장-기사 쌍에 대한 짧은 누락 맥락 설명을 생성하도록 요청하며, 결과로 나온 관계 텍스트를 대상 문장들과 맥락 기사들로 구성된 이종 그래프 (heterograph)에 입력합니다. Sheng et al.의 이중 언어 벤치마크에서, LCV는 영어와 중국어 분할 데이터셋에서 가장 강력한 누락 인지 베이스라인 (omission-aware baseline)보다 각각 macro-F1 점수 기준 $2.56$ 및 $2.84$를 향상시켰습니다. 이러한 결과는 단순히 검색된 증거를 첨부하거나 누락 신호를 예측하는 대신, 누락된 교차 출처 사실 자체를 모델링하는 것이 누락 인지 오정보 탐지에 유용한 표현 (representation)임을 나타냅니다.

Insights

Latent Causal Void: 오정보 탐지를 위한 명시적 누락 맥락 재구성

요약

핵심 포인트

댓글

AI 에이전트의 다음 단계인 「Graph Engineering」이란? ~Claude Code가 바꾸는 AI 시스템 설계~

AI 에이전트를 위한 기계 결제 가능 API를 구축하고 낯선 이들로부터 0달러를 벌었습니다. 모든 수치를 공개합니다.

IBM의 Krishna CEO, AI가 자사 소프트웨어 부문을 위협하지 않을 것이라며 투자자 안심시키려 노력

AMD EPYC Zen 7 "Florence", ACE 및 차세대 메모리 탑재 확인

AI 에이전트의 다음 단계인 「Graph Engineering」이란? ~Claude Code가 바꾸는 AI 시스템 설계~

AI 에이전트를 위한 기계 결제 가능 API를 구축하고 낯선 이들로부터 0달러를 벌었습니다. 모든 수치를 공개합니다.

IBM의 Krishna CEO, AI가 자사 소프트웨어 부문을 위협하지 않을 것이라며 투자자 안심시키려 노력

AMD EPYC Zen 7 "Florence", ACE 및 차세대 메모리 탑재 확인