논증 구조를 활용한 콘텐츠 적대성 예측
요약
본 논문은 온라인상의 오해의 소지가 있거나 적대적인 콘텐츠 확산 문제를 다루며, 특히 개별적인 문제 영역(적대적 표현, 허위정보 등)들을 연결하는 '논증 구조' 분석에 초점을 맞춥니다. 연구진은 WSF-ARG+ 데이터셋을 활용하여 메시지 내의 전제(premises)와 결론(conclusion) 단위로 주석을 달고, 이 논증 구성 요소들의 적절성 및 적대성을 분석함으로써 전체 메시지의 적대성을 예측하는 방법을 탐구했습니다. 그 결과 96% F1 점수라는 높은 성능을 보여주었으며, 이는 향후 적대적 콘텐츠 식별 시스템 개발에 중요한 방향을 제시합니다.
핵심 포인트
- 온라인 정보 왜곡 및 적대적 콘텐츠 확산은 포괄적인 해결책이 필요한 복합적인 문제입니다.
- 본 연구는 개별 문제 영역(허위정보, 적대성 등)을 연결하는 '논증 구조' 분석의 가능성을 제시합니다.
- WSF-ARG+ 데이터셋을 사용하여 메시지 내 전제와 결론 단위로 주석을 달고 적대성을 측정했습니다.
- 논증 구성 요소의 적절성(checkworthiness)과 적대성을 활용하여 전체 메시지의 적대성을 예측하는 모델이 96% F1 점수를 달성했습니다.
정보 질서는 사회 전반에 영향을 미치는 도전적인 현상입니다. 이 현상은 온라인에서 오해의 소지가 있는, 정보 왜곡을 일으키는, 그리고 적대적인 콘텐츠의 확산을 포함합니다. 다른 맥락에서는 문제의 한 측면이 우세할 수 있지만, 전체적으로 이는 포괄적인 해결책을 요구하는 광범위한 문제입니다. 문제의 각 차원 (적대적 표현, 허위정보, 오해 등) 은 심층 분석이 필요하지만, 이 논문에서는 이러한 문제의 서로 다른 영역을 연결하는 데 관련 정보를 제공하는 논증 구조의 가능성을 탐구합니다. 특히, 우리는 premises(전제) 및 conclusion(결론) 단위로 주석 처리된 white supremacy forum messages 로 구성된 WSF-ARG+ 데이터셋에 집중합니다. 거기서 우리는 논증 구성 요소의 적절성 (checkworthiness) 과 적대성 (hatefulness) 을 주석으로 활용하여 전체 메시지의 적대성을 통찰력을 얻습니다. 우리의 결과는 96% F1 점수까지 도달하는 유망한 통찰을 보여주어, 향후 적대적 콘텐츠 식별 및 정보 질서 대응에 이 방향을 확장할 가능성을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기