외부 지식과 성찰적 사고 사슬(Reflective Chain-of-Thought) 추론을 통해 강화된 제로샷 트윗 수준 입장 탐지
요약
트윗의 문맥 희소성과 암시적 대상 문제를 해결하기 위해 외부 지식과 성찰적 사고 사슬(Reflective CoT)을 결합한 KIRP 프레임워크를 제안합니다. 지식 그래프 통합과 대조 학습을 통해 제로샷 입장 탐지 성능을 최신 수준(SOTA)으로 끌어올렸습니다.
핵심 포인트
- KIRP 프레임워크를 통한 제로샷 트윗 입장 탐지 성능 향상
- 지식 그래프와 성찰적 CoT를 활용한 암시적 대상 추출 및 검증
- 중립과 무관 레이블 구분을 위한 입장 인식 대조 학습 채택
- SemEval-2016 등 주요 벤치마크에서 SOTA 성능 달성
제로샷(Zero-shot) 트윗 수준 입장 탐지(Stance Detection)는 두 가지 주요 과제에 직면해 있습니다: (1) 짧은 텍스트에 내재된 문맥 희소성(context sparsity) 완화, (2) 암시적 대상(implicit targets)과 텍스트 내용 간의 관련성 확립입니다. 기존 방법들은 주로 외부 지식을 통합하는 데 집중하고 있지만, 텍스트 내부의 핵심 엔티티(entity)에 내재된 본질적인 의미론적 단서(semantic cues)는 간과하고 있습니다. 또한, 현재 모델들은 주어진 텍스트와 보지 못한 대상(unseen targets) 간의 관련성을 결정하는 능력이 제한적이어서, "중립(neutral)"과 "무관(irrelevant)" 입장 레이블을 구분하는 데 어려움을 겪습니다. 이러한 문제를 해결하기 위해, 우리는 먼저 4개 클래스, 다중 토픽의 일본어 트윗 데이터셋을 구축했습니다. 우리가 알기로는, 이것이 입장 탐지를 위한 최초의 일본어 트윗 수준 데이터셋입니다. 그런 다음 우리는 제로샷 입장 탐지 프레임워크인 KIRP를 제안합니다. KIRP는 데이터 증강을 위해 엔티티 재구성(entity reorganization)과 외부 지식을 통합하며, 추론을 위해 프롬프트 체이닝(prompt chaining)을 사용합니다. 구체적으로, 이 프레임워크는 지식 그래프(knowledge graphs)를 통합하여 핵심 텍스트 엔티티를 보완하고 재구성하는 한편, 성찰적 사고 사슬(Reflective Chain-of-Thought, CoT) 추론을 통해 암시적 대상을 추출하고 검증합니다. "중립"과 "무관" 레이블을 더 잘 구분하기 위해, 우리는 변별적 특징(discriminative features)을 포착하는 입장 인식 대조 학습(stance-aware contrastive learning)을 채택하고, 세밀한 분류를 위해 3층 반복 프로토타입 네트워크(three-layer iterative prototype network)를 설계했습니다. SemEval-2016, WT-WT, KIRP-D에 대한 실험 결과, KIRP는 최첨단(state-of-the-art) 성능을 달성했습니다. KIRP는 SemEval-2016에서 84.05%(3개 클래스)의 F1 점수를 기록했으며, WT-WT와 KIRP-D에서는 각각 84.99%와 79.18%(4개 클래스)의 F1 점수를 얻었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기