예측 시장에서의 입장 탐지: 반사실적 증강(Counterfactual Augmentation)과 시장 문맥을 통한 불균형한 트레이더 코멘터리
요약
예측 시장의 트레이더 코멘트에서 방향성 입장을 탐지하는 연구를 소개합니다. RoBERTa-base 모델을 활용하여 시장 문맥과 Anthropic API 기반의 반사실적 증강(Counterfactual Augmentation)이 성능에 미치는 영향을 분석했습니다.
핵심 포인트
- 시장 문맥 포함 시 Anti 재현율이 0.10에서 0.45로 대폭 향상됨
- Anthropic API를 이용한 반사실적 데이터 증강 기법 적용
- 50% 수준의 데이터 증강이 성능 최적화를 위한 최적 용량임
- 과도한 증강(100%)은 오히려 모델 성능을 저하시킴
Polymarket과 같은 예측 시장(Prediction markets)은 대중의 믿음을 실시간 확률 추정치로 집계하며, 각 시장 아래에 트레이더들이 게시하는 코멘트(comments)에는 가격만으로는 포착할 수 없는 풍부한 방향성 입장 신호(directional stance signals)가 포함되어 있습니다. 본 연구는 예측 시장 코멘터리에 적용된 최초의 입장 탐지(stance detection) 연구를 소개합니다. 이 도메인은 극도의 짧은 길이, 트레이더 특유의 속어(vernacular), 그리고 심각한 클래스 불균형(class imbalance, 코멘트의 8.7%만이 시장 결과에 반대함)이라는 특징을 가집니다. RoBERTa-base 모델은 4 x 3 어블레이션(ablation) 실험을 통해 미세 조정(fine-tuned)되었습니다: 4가지 입력 구성({2-class, 3-class} x {시장 문맥 포함/미포함})과 3가지 증강(augmentation) 조건(baseline, 50% 합성, 100% 합성)입니다. 소수 클래스의 합성 샘플은 Anthropic API를 사용하여 LLM 기반의 Pro -> Anti 반사실적 뒤집기(counterfactual flips)를 통해 생성되었습니다. 결과에 따르면 (1) 시장 문맥(market context)이 단일 요소 중 가장 영향력 있는 요인으로, 3-class Anti 재현율(recall)을 0.10에서 0.45로 높였습니다; (2) 반사실적 증강(counterfactual augmentation)은 조건부로 효과적이며, 약한 구성에서는 Anti F1을 개선(0.10 -> 0.24)하는 반면, 강력한 구성에서는 성능을 저하시켰습니다(2-class-ctx macro F1: 전체 용량 적용 시 0.68 -> 0.50); (3) 50% 증강이 최적의 용량(optimal dose)이며, 100% 증강은 지속적으로 성능을 해치는 것으로 나타났습니다. 어텐션 기반 해석 가능성(Attention-based interpretability) 분석은 이 세 가지 발견 모두에 대해 메커니즘적 근거를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기