확신이 인위적 산물일 때: 키워드 어휘 목록의 맹점과 수사적 태도 (Mis)측정
요약
키워드 기반 어휘 목록을 활용한 통계 분석이 측정 도구의 인위적 산물(artifact)로 인해 왜곡될 수 있음을 경고합니다. LLM 기반의 의미론적 분류를 통해 기존 키워드 카운팅 방식이 가진 통사적·다의적 맹점을 증명하고 분석의 정확성을 높이는 방안을 제시합니다.
핵심 포인트
- 키워드 카운팅 방식은 수사적 태도를 왜곡하는 인위적 산물을 생성할 수 있음
- LLM 기반 제로샷 의미론적 분류가 기존 키워드 방식보다 정확한 분석 제공
- 키워드 목록의 세 가지 실패 모드: 통사적, 다의성, 범주적 맹점
- 단어 빈도를 인식적 확신의 지표로 사용하는 것은 범주 오류임
계산 사회 과학 (Computational Social Science)에서 통계적으로 유의미하고 큰 효과 크기를 가진 발견이 전적으로 측정 도구의 인위적 산물(artifact)일 수 있을까요? 우리는 그 답이 '예'인 사례를 제시합니다. 네 명의 공적 지식인(2016--2026)을 대상으로 한 85개의 인터뷰를 분석한 결과, 키워드 기반 점수 산정 방식에서 강력한 부정적 정서/강조적 확신 (negative-affect/emphatic-certainty) 어휘 공생 패턴이 발견되었습니다 ($r = 0.72$--$0.93$, 네 명의 화자 모두에 대해 $p < 0.01$). 전체 화자 분리 코퍼스 (diarized corpus, 32,625개 문장)에 대해 키워드 카운팅을 LLM 기반의 제로샷 의미론적 분류 (zero-shot semantic classification)로 대체하자 이 상관관계가 극적으로 감소했습니다. Dalio의 $r = 0.851$은 $r = 0.206$으로 떨어졌으며, 두 명의 화자는 음의 $r( ext{neg}, ext{emphatic})$을 보였고 한 명은 상관관계가 없는(null) 결과를 보였습니다. 반면, LLM은 화자 전반에 걸쳐 강력한 부정-완곡어법 (negative-hedging) 결합을 드러냈습니다. 즉, Rogoff의 $r( ext{neg}, ext{hedged}) = 0.875$ ($p = 0.001$)와 Zeihan의 $r( ext{neg}, ext{hedged}) = 0.722$ ($p = 0.008$)는 비관적 담론이 확신이 아닌 완곡어법을 유도한다는 전통적인 기대와 일치합니다. 문장 수준의 오류 분석을 통해 이러한 불일치의 원인을 키워드 어휘 목록의 세 가지 구조적 실패 모드인 통사적 맹점 (syntactic blindness), 다의성 맹점 (polysemy blindness), 그리고 범주적 부재 (categorical absence)로 추적했습니다. 이는 키워드 카운팅이 의미를 반전시키는 사례(예: ''never absolutely totally confident''가 높은 확신 점수로 측정됨)를 통해 설명됩니다. 우리는 키워드 어휘 목록이 수사적 태도 (rhetorical stance)와는 직교하며 이를 체계적으로 뒤집을 수 있는 보편적인 어휘 공생 경향, 즉 부정적 담론이 자연스럽게 강조 어휘를 끌어들이는 경향을 측정한다고 주장합니다. 키워드 빈도를 인식적 확신 (epistemic certainty)의 측정치로 취급하는 것은 범주 오류 (category error)입니다. 화자의 심리에 관한 것처럼 보이는 발견이 실제로는 전적으로 단어의 개수를 세는 방식에 관한 것일 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기