혐오 표현과 오정보의 교차점에서 이루어지는 보조적 대응 발언(Counterspeech) 작성

혐오 표현(Hate speech)과 오정보(Misinformation)는 온라인에서 빈번하게 동시에 발생하며, 편견과 양극화를 증폭시킵니다. 그 규모를 고려할 때, 전문가의 대응 발언(Counterspeech, CS) 작성을 보조하기 위해 거대 언어 모델(Large Language Models, LLMs)을 사용하는 것에 대한 관심이 높아지고 있으나, 기존 연구들은 이러한 현상들을 각각 별개로 다루어 왔습니다. 본 연구에서는 혐오와 오정보가 동시에 발생하는 맥락에서의 CS 생성을 연구함으로써 이 간극을 메웁니다. 우리는 세 가지 지식 기반 생성 전략을 테스트합니다. 첫째, 팩트체커(Fact-checkers)의 가이드라인과 팩트체크 기사를 사용하여 LLM에 프롬프트를 제공합니다. 둘째, NGO의 가이드라인과 보고서를 사용합니다. 셋째, 양측의 가이드라인과 문서를 결합한 혼합 전략을 생성합니다. 23명의 전문가가 생성된 CS를 수정하였으며, 이는 인간 및 자동화된 지표를 통해 평가되었습니다. LLM은 40%의 사례에서 적절한 CS를 생성하였으나, 전문가의 편집은 자연스러움(Naturalness), 포괄성(Exhaustiveness), 그리고 가이드라인 준수(Adherence to guidelines) 측면을 실질적으로 개선했습니다. 사후 편집된 CS를 바탕으로 한 크라우드소싱 평가 결과, 혼합 전략이 강력한 사실 교정(Factual correction)과 고정관념 완화(Stereotype mitigation) 및 공감적 참여(Empathetic engagement)를 결합하여 가장 효과적임이 입증되었습니다. 우리는 전문가가 검증한 CS와 지원 지식을 포함한, 혐오적이고 오정보가 담긴 주장 데이터셋을 공개합니다.

Insights

혐오 표현과 오정보의 교차점에서 이루어지는 보조적 대응 발언(Counterspeech) 작성

요약

핵심 포인트

댓글

중국이 답이었다 — 테슬라 6월 판매 8만9091대 올해 최고, 모델Y 현지 1위 | 7/8 테슬라 브리핑

짐 크레이머, 강세장 재도래의 큰 위험은 이란 전쟁이 아니다

AI 비디오에 대한 일반적인 인식과 Reactor의 더 큰 방향성

HF Viewer에 수많은 새로운 기능이 추가되었습니다!

짐 크레이머, 강세장 재도래의 큰 위험은 이란 전쟁이 아니다

AI 비디오에 대한 일반적인 인식과 Reactor의 더 큰 방향성

HF Viewer에 수많은 새로운 기능이 추가되었습니다!