뉴스 이벤트의 흐름: 재난 관련 텍스트 기반 데이터 수집을 위한 상향식(Bottom-Up) 및 하향식(Top-Down) 접근 방식 비교
요약
재난 관련 뉴스 데이터 수집을 위한 상향식(Bottom-Up)과 하향식(Top-Down) 접근 방식을 비교 분석한 연구입니다. 독일의 산사태 뉴스 데이터셋을 활용하여 두 방식의 이벤트 커버리지 차이와 데이터 샘플링의 영향력을 논의합니다.
핵심 포인트
- 재난 데이터 수집을 위한 두 가지 방법론적 접근 방식 비교
- 하향식: 기존 재난 인벤토리를 활용한 뉴스 데이터베이스 쿼리
- 상향식: NLP 클러스터링을 통한 시간적·공간적 특징 기반 수집
- 연구 설계 결정이 뉴스 샘플의 대표성과 미디어 커버리지 분석에 미치는 영향 확인
뉴스 기사는 재난의 영향과 적응에 관한 중요한 정보원입니다. 사회 환경 연구(socio-environmental studies)에서 핵심적인 방법론적 과제는 어떻게 대표성 있는 데이터 샘플을 선택하느냐 하는 것입니다. 두 가지 접근 방식이 흔히 사용됩니다. 기존의 재난 인벤토리(disaster inventory)의 도움을 받아 뉴스 데이터베이스를 하향식(top-down)으로 쿼리하거나, NLP(자연어 처리) 방법을 사용하여 시간적 및 공간적 특징을 기반으로 뉴스 텍스트를 상향식(bottom-up)으로 클러스터링(clustering)하는 것입니다. 전 세계 산사태에 관한 독일 뉴스 데이터셋을 사용하여, 우리는 이러한 접근 방식들을 비교하고 이벤트 커버리지(event coverage)의 차이를 논의합니다. 이러한 연구 설계 결정은 결과적인 뉴스 샘플에 영향을 미칠 수 있으며, 이는 미디어 커버리지의 불평등, 재난 모니터링 및 인벤토리 보강(inventory enrichment) 연구에서의 활용에 영향을 줄 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기