COVID-19 Infodemic. Understanding content features in detecting fake news using

가짜 뉴스 탐지에 텍스트 및 언어적 특징을 사용하는 것은, 실제 뉴스와 가짜 뉴스를 구분하는 데 기여할 수 있다는 실증적 증거에도 불구하고 연구가 부족합니다. 이에 본 연구는 단어 bigrams(이문), 품사 분포 등의 선택된 콘텐츠 특징을 조사하여 가짜 뉴스 탐지를 개선합니다. 우리는 COVID-19 팬데믹 기간에 수집한 새로운 데이터셋에서 Decision Tree, K-Nearest Neighbor, Logistic Regression, Support Vector Machine, Random Forest를 사용하여 실험을 수행했습니다. 모든 설정에서 Random Forest가 가장 좋은 결과를 보였으며, Support Vector Machine이 그 뒤를 이었습니다. 일반적으로 텍스트 및 언어적 특징은 개별적으로 사용될 때 가짜 뉴스 탐지를 개선하는 것으로 확인되었으나, 이를 단일 모델로 결합할 때는 탐지가 유의미하게 개선되지 않았습니다. bigrams 와 품사 태그의 사용 간에도 차이가 있었습니다. 본 연구는 전통적인 머신러닝 접근법을 사용하여 가짜 뉴스를 탐지할 때 텍스트 및 언어적 특징이 성공적으로 사용될 수 있음을 보여줍니다.

Insights

COVID-19 Infodemic. Understanding content features in detecting fake news using

요약

핵심 포인트

댓글

Deepseek V4 Flash 모델을 두 개의 Nvidia 4090d 48G GPU에서 vLLM으로 구동한 성능 분석

BrassCoders가 잡아낼 수 없는 공격: 프롬프트 인젝션 (Prompt Injection)

영국 CFO들, 비용 통제를 대졸 신입 채용 축소의 주요 원인으로 지목

밀레니얼 세대를 위한 401(k) 저축 기준: 당신의 은퇴 자금은 계획대로 진행되고 있습니까?

BrassCoders가 잡아낼 수 없는 공격: 프롬프트 인젝션 (Prompt Injection)

영국 CFO들, 비용 통제를 대졸 신입 채용 축소의 주요 원인으로 지목

밀레니얼 세대를 위한 401(k) 저축 기준: 당신의 은퇴 자금은 계획대로 진행되고 있습니까?