측정 장치로서의 언어 모델 (Language Models as Measurement Apparatus)과 문화
요약
언어 모델이 문화적 현상을 정량화할 때, 모델과 데이터, 평가 방식이 문화적 현실을 단순히 기록하는 것이 아니라 능동적으로 구성한다는 점을 논합니다. 카렌 바라드의 '행위적 절단' 개념을 통해 모델 설계가 문화적 경계를 획정하는 과정을 분석합니다.
핵심 포인트
- 언어 모델은 문화적 현실을 수동적으로 기록하지 않고 구성함
- 모델, 데이터, 주석, 평가가 결합된 '장치'로서의 역할 강조
- 설계 선택이 문화적 경계를 긋는 '행위적 절단'을 유발함
- 텔레비전 및 영화 대화 사례를 통한 이론적 검증
언어 모델 (Language models)은 문화적 현상을 정량화하는 데 점점 더 많이 사용되고 있지만, 무엇이 그러한 측정을 독특하게 문화적으로 만드는가? 본 논문은 문화에 대한 자연어 처리 (NLP) 작업이 물질적-담론적 실천 (material-discursive practice)이라고 주장한다. 즉, 장치(apparatus) — 모델, 데이터, 주석 (annotation), 평가 (evaluation) — 는 문화적 현실을 수동적으로 기록하는 것이 아니라, 그것이 측정하는 문화적 현실을 구성하는 데 참여한다. 현상과 도구 사이의 우발적 경계인 카렌 바라드 (Karen Barad)의 '행위적 절단 (agential cut)' 개념을 빌려, 나는 장치의 실질적인 설계 선택이 그러한 경계를 긋고 있으며, 언어 모델이 이미 자신이 측정하는 문화적 자료의 상당 부분을 내재화했기 때문에 그 경계는 처음부터 얽혀 있다는 것을 보여준다. 나는 이를 텔레비전 및 영화 대화에 대한 세 가지 사례 연구 (구조, 상호작용, 편차 측정)와 장치 자체에 대한 세 가지 검토 (문화적 표식의 삭제, 역사적 자료에 대한 조율, 행위적 워크플로 (agentic workflow)에서의 주체성)를 통해 설명한다. 이러한 거시적 분석은 이론 중심적이고, 경험적으로 엄격하며, 문화적으로 부수적인(culturally contingent) 연구 프로그램을 제안하며, 각 행위적 절단을 방법론적이면서 동시에 윤리적인 의식적 약속으로 취급한다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기