다언어 사회에서의 언어 이데올로기: Luxembourgish 뉴스 댓글을 위한 LLM 기반 분석

언어 이데올로기를 탐지하는 것은 담론을 통해 정체성이 어떻게 구성되는지를 이해하기 위해 가치 있지만 복잡한 작업입니다. Luxembourg 의 다문화 및 다언어 사회에서 언어 이데올로기는 단순한 선호도를 넘어 깊은 문화적·사회적 의미를 지니며, 정체성과 사회적 소속감을 형성합니다. 최근 자연어 처리 도구 (NLP) 를 언어학 및 사회과학에 적용하는 발전 이후, 본 논문은 대규모 언어 모델 (LLM) 을 언어 이데올로기 탐지에 활용하는 잠재력을 탐구합니다. 우리는 Luxembourgish 의 사용자 댓글 데이터셋을 사전 정의된 이데올로기 범주와 함께 수동으로 주석화하고, 다양한 프롬프트 조건 하에서 대규모 언어 모델의 성능을 평가하여 이러한 인간 주석 복제 능력을 평가했습니다. Luxembourgish 는 소규모 언어이며 LLM 의 훈련 데이터에 잘 반영되지 않았으므로, 우리는 또한 기계 번역을 통해 데이터를 고자원 언어로 변환하는 것이 이데올로기 탐지 작업의 성능을 향상시키는지 조사했습니다. 우리의 연구 결과는 LLM 이 다분류 이데올로기 주석 작업에 완전히 최적화되지는 않았지만, 언어 이데올로기 콘텐츠를 식별하기 위한 실용적인 도구임을 시사합니다.

Insights

다언어 사회에서의 언어 이데올로기: Luxembourgish 뉴스 댓글을 위한 LLM 기반 분석

요약

핵심 포인트

댓글

AI 인프라 논쟁이 진화함에 따라 Nvidia, Vera CPU 전략 강조

영국 데이터 센터 소유주, 140억 파운드 규모의 미국 기업 인수 제안 수용 예정

디지털 자산을 위한 새로운 벤치마크 지수 등장 — 비트코인은 제외되었다

Bank of America, AI 돌발 변수 이후 Micron 주식에 대한 투자 강화

영국 데이터 센터 소유주, 140억 파운드 규모의 미국 기업 인수 제안 수용 예정

디지털 자산을 위한 새로운 벤치마크 지수 등장 — 비트코인은 제외되었다

Bank of America, AI 돌발 변수 이후 Micron 주식에 대한 투자 강화