본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 06. 17:17

인도네시아 Spotify 리뷰의 감성 분석: 기계 학습 및 BiLSTM 성능 비교

요약

본 연구는 인도네시아 Spotify 리뷰 데이터셋에 대한 3 클래스 감성 분류 모델의 성능을 비교 분석합니다. 지원 벡터 머신, 나이브 베이즈 등 고전적인 기계 학습 방법과 BiLSTM 같은 딥러닝 접근법을 벤치마크하며, 동일한 전처리 파이프라인을 적용했습니다. 연구 결과, BiLSTM이 전체 감성 탐지에서 가장 높은 성능을 보였으나 소수 클래스(중립)에서는 어려움을 겪었으며, 기계 학습과 SMOTE를 결합하는 것이 더 균형 잡힌 결과를 제공할 수 있음을 제시합니다.

핵심 포인트

  • 인도네시아 Spotify 리뷰 감성 분석을 위해 고전 ML (SVM, Naive Bayes 등)과 딥러닝 (BiLSTM) 모델을 비교했습니다.
  • BiLSTM은 전체적인 성능(F1 점수)에서 최고치를 기록했지만, 소수 클래스(중립) 분류에서는 취약점을 보였습니다.
  • 의사결정 트리는 고전 ML 모델 중 가장 우수한 성능을 보여주었습니다.
  • 연구는 BiLSTM이 전반적인 감성 탐지에 강력하며, 기계 학습과 SMOTE를 결합하면 클래스 균형 개선에 도움이 될 수 있다고 결론지었습니다.

본 논문은 인도네시아 Spotify 리뷰에 대한 3 클래스 감성 분류를 위해 고전적인 기계 학습과 딥러닝 접근법을 벤치마크합니다. 100,000 개의 스크랩된 리뷰와 70,155 개의 정제된 샘플을 사용하여 지원 벡터 머신 (Support Vector Machine), 다항식 나임 베이즈 (Multinomial Naive Bayes), 그리고 의사결정 트리 (Decision Tree) 모델을 2 층 BiLSTM 과 비교합니다. 두 접근법은 모두 슬랭 정규화, 정지어 제거, 스텝밍을 포함한 동일한 전처리 파이프라인을 사용합니다. 의사결정 트리는 고전 모델 중 가장 좋은 성능을 보였으며, BiLSTM 은 전체 가중치 F1 점수에서 최고치를 기록했으나 소수류 중성 클래스에서는 실패했습니다. 본 논문은 BiLSTM 이 전체 감성 탐지에 더 강력하며, 기계 학습과 SMOTE 를 사용하면 더 균형 잡힌 3 클래스 성능을 제공한다고 결론지었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0