허위 정보 위협 완화를 위해 오픈 소스 LLM을 활용하는 멀티 에이전트 시스템 (Multi-Agentic System)
요약
허위 정보 탐지를 위해 인간의 의사 결정 과정을 모방한 멀티 에이전트 시스템을 제안하는 연구입니다. 오픈 소스 LLM을 활용하여 합의 메커니즘과 계층적 구조를 통합함으로써 기존 GPT 모델 대비 우수한 성능을 입증했습니다.
핵심 포인트
- 인간 주석가의 인지 및 지식 다양성을 모방한 멀티 에이전트 구조 제안
- LLaMA, Qwen, Deepseek 등 오픈 소스 모델을 활용한 투명성 확보
- 다양한 언어 자원(영어, 폴란드어, 슬로바키아어 등) 환경에서 성능 검증
- 단일 LLM 대비 허위 정보 탐지 및 사실적 주장 식별 능력 향상
현대 사회에서 허위 정보 (disinformation)의 위협은 전자 통신, 소셜 미디어의 확산, 그리고 인공지능 (AI)의 발전으로 인해 우려스러운 수준에 도달했습니다. 그 결과, 이러한 위협을 완화하기 위한 효과적인 대응책을 개발해야 할 긴급한 필요성이 제기되고 있습니다. 그러나 문제의 규모가 너무 방대하여 수동 팩트 체크 (fact-checking) 및 인간 기반의 검증만으로는 불충분하며, 이는 허위 정보를 탐지하고 반박하기 위한 자동화된 방법의 필요성을 강조합니다. 본 논문은 허위 정보 탐지 작업에 참여하는 인간 주석가 (human annotators)의 의사 결정 과정을 모방하는 멀티 에이전트 시스템 (multi-agent system) 기반의 새로운 접근 방식을 제안합니다. 인간 주석가의 행동에서 영감을 얻은 합의 메커니즘 (consensus mechanism), 인지의 다양성 (diversity in cognition), 지식의 다양성 (diversity in knowledge), 그리고 계층적 구조 (hierarchical structure)를 통합함으로써, 제안된 방법은 GPT 4 및 GPT 3.5를 포함한 개별 대규모 언어 모델 (LLMs)과 비교하여 우수한 결과를 달성합니다. 이 시스템은 더 큰 투명성을 보장하기 위해 오픈 모델 (예: LLaMA, Kimi, Qwen, Deepseek 및 LLaMA-Nemotron)을 활용합니다. 제안된 방법의 평가는 영어 (고자원), 폴란드어 (중자원), 슬로바키아어 (저자원), 불가리아어 (저자원)를 포함하여 자원 가용성이 다양한 언어의 데이터셋을 포괄합니다. 실험은 직접적인 허위 정보 탐지, 검증 가치가 있는 텍스트 식별, 그리고 검증 가능한 사실적 주장 (verifiable factual claims)을 포함하는 텍스트 탐지와 같은 작업에 대해 수행되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기