강건한 이중 신호 융합: 소셜 미디어 텍스트의 반어법 탐지를 위한 압축된 사고 사슬 (CoT) 정교화를 결합한 하이브리드 신경-기호 게이팅
요약
LLM의 제로샷 반어법 탐지 성능을 높이기 위해 신경-기호 게이팅과 압축된 CoT를 결합한 RDS 프레임워크를 제안합니다. 이 방식은 미세 조정 없이도 기존 지도 학습 모델에 필적하는 높은 정확도와 환각 억제 능력을 보여줍니다.
핵심 포인트
- 신경-기호 아키텍처와 압축된 CoT를 결합한 RDS 프레임워크 제안
- TweetEval 테스트에서 78.1%의 높은 정확도 달성
- 동결된 CoT 파이프라인을 통해 OOD 환각의 22.5% 필터링
- 세 가지 신호의 동시 융합을 통해 통계적으로 유의미한 성능 개선 확인
대규모 언어 모델 (LLMs)은 기본적으로 문자 그대로의 의미론적 해석을 따르기 때문에, 제로샷 (zero-shot) 반어법 탐지는 지속적인 과제로 남아 있습니다. 우리는 지도 미세 조정 (Supervised Fine-Tuning, SFT) 없이 사고 사슬 (Chain-of-Thought, CoT) 추론 궤적을 압축하는 하이브리드 신경-기호 (neuro-symbolic) 아키텍처인 강건한 이중 신호 (Robust Dual-Signal, RDS) 융합 프레임워크를 소개합니다. 엄격하게 분리된 TweetEval 테스트 세트 (N=734)에서 평가했을 때, RDS는 78.1%의 정확도와 0.777의 Macro F1을 달성하여 미세 조정된 BERTweet의 절대적인 성능 상한선과 일치하는 결과를 보였습니다. 불균형이 심한 iSarcasm 데이터셋에서, 동결된 CoT 파이프라인은 분포 외 (out-of-distribution) 환각의 22.5%를 필터링하여 0.6726의 제로샷 Macro F1과 0.4821의 반어적 (Ironic) F1을 산출하였으며, 이는 다수의 강력한 지도 학습 기반 SemEval 트랜스포머 앙상블 모델들을 능가하는 성능입니다. 통계적 절제 연구 (ablation study)를 통해 이러한 구조적 시너지를 확인했습니다: 신경망 베이스라인에 기호적 사전 지식 (symbolic prior)을 추가하는 것은 유의미한 이득을 주지 못하며 (p = 0.242), 해당 사전 지식에 CoT 파이프라인을 추가함으로써 얻는 한계 이득 또한 크게 압축되었습니다 (p = 0.149). 오직 세 가지 신호의 완전하고 동시적인 융합만이 베이스라인 대비 통계적으로 검증된 개선을 달성했습니다 (p = 0.005).
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기