논란이 되는 정치 담론에서 엔티메메(Enthymemes) 탐지를 위한 자료
요약
본 자료는 정치적 담론 속 엔티메메(Enthymemes) 탐지를 위한 새로운 데이터셋과 방법론을 제시합니다. 1,482개의 트윗에 대해 다섯 명의 주석가가 레이블 변동성을 연구하도록 설계되었으며, 구조화된 주석 지침을 통해 해석적 특성을 유지하면서도 객관적인 분석이 가능하게 합니다.
핵심 포인트
- 엔티메메 탐지를 위한 1,482개 트윗 기반의 새로운 데이터셋 제공
- 다섯 명의 주석가 참여로 레이블 변동성 연구에 초점
- 주관성을 줄이면서도 구조화된 주석 지침을 제안함
- 의견 불일치 학습 모델이 단일 다수결보다 성능 우수함을 입증
명시되지 않은 전제나 결론을 가진 주장인 엔티메메(Enthymemes)는 설득적 담론에 만연해 있지만, 그 주석 작업은 악명이 높을 정도로 주관적입니다. 우리는 정치적으로 논란이 되는 담론에서 가져온 1,482개의 트윗으로 구성된 자료를 제시하며, 이 자료는 엔티메메의 존재 여부와 그 주장 구조에 대해 다섯 명의 주석가들이 주석을 달았으며, 레이블 변동성을 연구하도록 설계되었습니다. 우리는 먼저 엔티메메의 정의를 재검토하고 Walton의 논증 방식(argumentation schemes)에 기반한 주석 지침을 제안하여, 과제의 해석적 특성을 유지하면서도 구조화되고 제한적인 접근 방식을 제공합니다. 이는 과거 자료들이 의견 불일치를 제거하는 경향이 있어 그 출처를 모호하게 만들고 모델 성능 향상을 위한 잠재적 이점을 조사하는 것을 막았던 것과 대조됩니다. 나아가 우리는 과제에 대한 복잡도 분석을 제안하여, 주석 작업이 높은 인지 부하를 가하고 일관성 없는 주석을 유발할 수 있는 지점을 식별합니다. 우리의 예비 실험은 주석가 간의 의견 불일치로 학습된 모델이 단일 다수결 투표(hard majority-vote) 레이블로 학습된 모델보다 성능이 우수함을 보여줍니다. 마지막으로, 우리는 엔티메메 정의와 지침의 구조적 개방성이 미래 자료 및 인간 추론과 관련된 다운스트림 NLP 응용 분야에서 주관적인 추론 과정의 변동성을 연구할 수 있도록 어떻게 가능하게 하는지에 대해 논합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기