arXiv논문2026. 06. 03. 11:04

SemEval-2026 Task 9: 양극화 탐지를 위한 프롬프트 변체 평가를 수행한 Lingo_Research_Group

요약

SemEval-2026 Task 9를 위해 Lingo_Research_Group이 제안한 양극화 탐지 연구입니다. 12개의 다양한 프롬프트 설계를 통해 aya-101 및 Gemma3-27B 모델의 성능을 다국어 환경에서 평가했습니다.

핵심 포인트

양극화 탐지의 3가지 하위 작업 수행
프롬프트 설계 요소(명확성, 상세함 등)에 따른 체계적 연구
Gemma3-27B를 최종 제출 모델로 채택
거친 입도 탐지에는 효과적이나 미세 입도 분류에는 한계 존재

본 논문에서 제시하는 우리의 제출물은 SemEval-2026 Task 9: 다국어 텍스트 분류 챌린지 - 양극화 탐지 (Polarization Detection)를 위한 것이며, 다음의 세 가지 하위 작업 (subtasks)을 모두 다룹니다: (1) 이진 양극화 탐지 (binary polarization detection), (2) 양극화 유형 분류 (polarization type classification), (3) 양극화 발현 식별 (polarization manifestation identification). 우리는 용어의 명확성 (terminology clarity), 정의의 상세함 (detail of the definition), 추론 가이드 (guidance of reasoning), 그리고 인컨텍스트 예시 (in-context examples) 사용 측면에서 서로 다른 12개의 설계된 프롬프트를 고려하여, 짧게 설계된 프롬프트에 대한 체계적인 연구 접근 방식을 채택합니다. 실험은 aya-101 및 Gemma3-27B를 사용하여 수행되었으며, 후자는 개발 마지막 단계에서 성능 고려 사항에 따라 제출 모델로 선택되었습니다. 우리의 시스템은 22개 언어의 평균을 낸 공식 테스트 세트에서 하위 작업 1에 대해 평균 Macro F1-score 0.762 (평균 정확도 0.819), 하위 작업 2에 대해 0.587 (평균 정확도 0.678), 하위 작업 3에 대해 0.444 (평균 정확도 0.498)를 기록했습니다. 작업 간 분석 (cross-task analysis) 및 언어 간 분석 (cross-lingual analysis)을 통해, 우리는 프롬프트 기반 접근 방식이 거친 입도 (coarse grained)의 양극화를 탐지하는 데 효과적으로 사용될 수 있지만, 미세한 입도 (fine-grained) 및 다중 레이블 사회언어학적 분류 (multi-label sociolinguistic classification)와 관련될수록 점점 더 많은 어려움에 직면한다는 것을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

SemEval-2026 Task 9: 양극화 탐지를 위한 프롬프트 변체 평가를 수행한 Lingo_Research_Group

요약

핵심 포인트

댓글