SemEval-2026 Task 9: 양극화 탐지를 위한 프롬프트 변체 평가를 수행한 Lingo_Research_Group
요약
SemEval-2026 Task 9를 위해 Lingo_Research_Group이 제안한 양극화 탐지 연구입니다. 12개의 다양한 프롬프트 설계를 통해 aya-101 및 Gemma3-27B 모델의 성능을 다국어 환경에서 평가했습니다.
핵심 포인트
- 양극화 탐지의 3가지 하위 작업 수행
- 프롬프트 설계 요소(명확성, 상세함 등)에 따른 체계적 연구
- Gemma3-27B를 최종 제출 모델로 채택
- 거친 입도 탐지에는 효과적이나 미세 입도 분류에는 한계 존재
본 논문에서 제시하는 우리의 제출물은 SemEval-2026 Task 9: 다국어 텍스트 분류 챌린지 - 양극화 탐지 (Polarization Detection)를 위한 것이며, 다음의 세 가지 하위 작업 (subtasks)을 모두 다룹니다: (1) 이진 양극화 탐지 (binary polarization detection), (2) 양극화 유형 분류 (polarization type classification), (3) 양극화 발현 식별 (polarization manifestation identification). 우리는 용어의 명확성 (terminology clarity), 정의의 상세함 (detail of the definition), 추론 가이드 (guidance of reasoning), 그리고 인컨텍스트 예시 (in-context examples) 사용 측면에서 서로 다른 12개의 설계된 프롬프트를 고려하여, 짧게 설계된 프롬프트에 대한 체계적인 연구 접근 방식을 채택합니다. 실험은 aya-101 및 Gemma3-27B를 사용하여 수행되었으며, 후자는 개발 마지막 단계에서 성능 고려 사항에 따라 제출 모델로 선택되었습니다. 우리의 시스템은 22개 언어의 평균을 낸 공식 테스트 세트에서 하위 작업 1에 대해 평균 Macro F1-score 0.762 (평균 정확도 0.819), 하위 작업 2에 대해 0.587 (평균 정확도 0.678), 하위 작업 3에 대해 0.444 (평균 정확도 0.498)를 기록했습니다. 작업 간 분석 (cross-task analysis) 및 언어 간 분석 (cross-lingual analysis)을 통해, 우리는 프롬프트 기반 접근 방식이 거친 입도 (coarse grained)의 양극화를 탐지하는 데 효과적으로 사용될 수 있지만, 미세한 입도 (fine-grained) 및 다중 레이블 사회언어학적 분류 (multi-label sociolinguistic classification)와 관련될수록 점점 더 많은 어려움에 직면한다는 것을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기