본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 30. 16:07

Masked Language Model 을 활용한 극성 분석을 위한 새로운 준지도 기법

요약

본 기술 기사는 Word2Vec 기반의 마스크드 언어 모델(MLM)을 활용하여 잠재적 의미 스케일링(LSS)의 새로운 버전을 개발하고, 이를 통해 텍스트에 극성 점수를 할당하는 준지도 기법을 제안합니다. 이 방법은 시드 단어가 주어진 문맥에서 발생할 확률을 기반으로 단어와 문서에 극성 점수를 부여하며, 기존 공간적 모델보다 더 정확하고 해석 가능하며 일관성이 높은 것으로 나타났습니다. COVID-19 팬데믹 기간 동안의 언론 보도 분석 사례를 통해 제안된 방법이 우수한 성능을 입증했습니다.

핵심 포인트

  • Word2Vec 기반 MLM을 활용하여 잠재적 의미 스케일링(LSS)의 새로운 극성 분석 기법을 개발함.
  • 제안된 방법은 시드 단어의 문맥 발생 확률을 이용해 단어와 문서에 극성 점수를 할당합니다.
  • 이 확률적 접근 방식은 기존 공간적 모델보다 높은 정확도, 해석 가능성, 일관성을 제공합니다.
  • COVID-19 팬데믹 기간 동안의 언론 보도를 분석하여 제안된 방법의 우수성을 실증적으로 입증했습니다.

저는 word2vec 를 마스크드 언어 모델 (masked language model) 로 사용하여 잠재적 의미 스케일링 (Latent Semantic Scaling, LSS) 의 새로운 버전을 개발했습니다. 기존 공간적 모델과 달리, 이 방법은 시드 단어 (seed words) 가 주어진 문맥에서 발생할 확률로 단어와 문서에 극성 점수 (polarity scores) 를 할당합니다. 이러한 확률적 극성 점수는 텍스트 분석에서 공간적 극성 모델이 생성할 수 있는 점수보다 더 정확하고, 해석 가능하며 일관성이 있습니다. 저자는 건강 문제에서의 성과 측면에서 코로나바이러스 감염증 (COVID) 팬데믹 기간 동안 중국 일일 (China Daily) 이 중국과 다른 국가들을 보도한 내용을 대상으로 확률적 모델과 공간적 모델을 모두 적용하여 이러한 장점을 입증했습니다. 결과는 더 발전된 마스크드 언어 모델이 준지도 기계 학습 기법을 더욱 개선할 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
8

댓글

0