arXiv논문2026. 05. 05. 13:13

SemEval-2026 과제 10: 혼란 이론 탐지용 LLM 파인튜닝 (mdok 스타일)

요약

SemEval-2026 과제 10은 Reddit 댓글의 혼란 이론(conspiracy theory) 믿음 여부를 탐지하는 것을 목표로 합니다. 이 시스템은 Qwen3-32B 모델을 사용하여 데이터 증강 및 자기 학습 기법으로 파인튜닝되었으며, 이진 텍스트 분류 작업에 적용되었습니다. 해당 접근 방식은 경쟁력 있는 성능을 보여주며, 기존의 기계 생성 텍스트 탐지 기술이 혼란 이론 탐지에도 효과적으로 활용될 수 있음을 입증했습니다.

핵심 포인트

SemEval-2026 과제 10은 Reddit 댓글 기반의 혼란 이론(conspiracy theory) 탐지를 주요 목표로 합니다.
Qwen3-32B 모델을 사용하여 데이터 증강 및 자기 학습 기법으로 파인튜닝하여 높은 성능을 달성했습니다.
본 시스템은 이진 텍스트 분류 작업에 성공적으로 적용되었으며, 경쟁적인 순위(85 퍼센타일)를 기록했습니다.
기계 생성 텍스트 탐지에서 개발된 방법론이 혼란 이론과 같은 사회적 현상 탐지에도 확장 가능함을 시사합니다.

SemEval-2026 과제 10 는 혼란 이론 탐지에 집중하고 있습니다. 구체적으로, 목표는 Reddit 댓글이 혼란 이론을 믿고 있는지 여부进行检测입니다. 제출된 mdok 스타일 시스템은 데이터 증강과 자기 학습 (소량 훈련 데이터를 극복하기 위해) 을 사용하여 Qwen3-32B 모델을 이진 텍스트 분류 작업에 파인튜닝했습니다. 제출된 시스템은 매우 경쟁력 있으며, 52 개 제출물 중 8 위 (85 퍼센티일 순위) 를 기록했습니다. 결과가 보여주듯, 우리 접근법은 기계 생성 텍스트 탐지에서 시작되었으나 혼란 이론 탐지에도 사용될 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기