본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 15. 11:20

이탈리아 미디어에서의 역사적 전환점 탐지: 통시적 뉴스 코퍼스에 대한 복잡계 접근 방식

요약

이탈리아 신문 'La Repubblica'의 대규모 통시적 코퍼스를 활용하여 역사적 전환점을 탐지하는 정량적 분석 방법을 제시합니다. NLP와 복잡계 이론을 결합하여 사전 라벨링 없이도 주요 정치·사회적 변화 시기를 추적할 수 있음을 보여줍니다.

핵심 포인트

  • NLP와 복잡계/통계 물리학 도구를 결합한 새로운 역사 분석 방법론 제시
  • 1985~2000년 사이의 이탈리아 뉴스 코퍼스 60만 건 재구성
  • 어휘적·의미적 분석을 통해 라벨링 없이 주요 역사적 전환점 탐지 가능
  • 계산 언어학을 통한 미디어 및 사회 역학 연구의 새로운 경로 확보

대규모 텍스트 코퍼스 (textual corpora)의 가용성이 증가함에 따라, 자연어 처리 (NLP)를 활용한 데이터 기반의 정량적 역사 분석에 새로운 가능성이 열렸습니다. 그러나 디지털 이전 시대의 역사적 관련성을 지닌 통시적 코퍼스 (diachronic corpora)는 여전히 부족하며 종종 불완전합니다. 본 연구에서는 이탈리아 신문인 "La Repubblica"의 약 600,000개 기사로 구성된 통시적 코퍼스를 재구성하고 탐색하는 것에 기반한 역사 분석의 정량적 접근 방식을 제시합니다. 이 코퍼스는 이탈리아 및 전 세계적으로 정치적, 사회적, 지정학적 변화가 컸던 시기인 1985년 1월 1일부터 2000년 12월 31일까지 발행된 모든 기사를 포함합니다. NLP 기술을 사용하여 어휘적 (lexical) 및 의미적 (semantic) 수준 모두에서 텍스트를 분석하며, 이후 복잡계 (complex systems) 및 통계 물리학 (statistical physics)의 도구들을 적용하여 시간에 따른 미디어 담론의 변화를 추적합니다. 이를 통해 사전 라벨링 (prior labeling)에 의존하지 않고도 이탈리아의 제1공화국에서 제2공화국으로의 전환이나 걸프전 또는 코소보 전쟁과 같은 주요 국제적 갈등과 같은 핵심적인 전환기를 탐지할 수 있습니다. 연구 결과는 계산 언어학 (computational linguistics)을 복잡계의 아이디어와 결합하는 것이 역사적 변화에 대한 새로운 정량적 통찰을 어떻게 제공할 수 있는지 보여주며, 대규모 텍스트 데이터를 통해 미디어와 사회의 역학을 연구하는 새로운 경로를 열어줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0