본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 30. 15:54

PyCaret AutoML 과 BiLSTM 을 활용한 정교한 감정 분류 벤치마킹: 20 개 클래스 감정 감지 비교 연구

요약

본 연구는 '20-Emotion Text Classification Dataset'을 활용하여 20개 클래스에 대한 정교한 감정 분류 성능을 비교 분석했습니다. 로지스틱 회귀, SVM 등 전통적인 머신러닝 모델과 BiLSTM, GRU, 트랜스포머 같은 최신 딥러닝 아키텍처를 벤치마킹했습니다. 그 결과, BiLSTM이 높은 정확도와 F1 점수를 기록하며 전반적인 성능에서 가장 우수한 결과를 보였으며, 이는 순서 기반의 딥러닝 모델이 텍스트의 문맥적 감정 단서를 포착하는 데 효과적임을 입증합니다.

핵심 포인트

  • 20개 클래스 정교한 감정 분류는 자연어 처리 분야에서 여전히 도전적인 과제이다.
  • 벤치마킹된 모델 중 BiLSTM이 가장 높은 성능(정확도 89%, F1 점수 0.89)을 보여 전반적으로 우수한 결과를 달성했다.
  • 전통적인 머신러닝 모델(예: SVM)은 여전히 경쟁력이 있고 계산 효율적이지만, 딥러닝 모델이 문맥 이해에서 강점을 가진다.
  • 본 연구는 감정 분류를 위해 다양한 ML/DL 접근법을 비교하고 최적의 아키텍처를 탐색하는 가이드라인을 제공한다.

행복, 분노, 슬픔, 두려움과 같은 특정 감정 상태를 식별하는 정교한 감정 분류 (fine-grained emotion classification) 는 자연어 처리 분야에서 여전히 어려운 과제로 남아있습니다. 본 연구는 79,595 개의 영어 문장으로 구성된 '20-Emotion Text Classification Dataset'을 사용하여 20 개 클래스 감정 분류를 위한 고전적 머신러닝 및 딥러닝 접근법을 벤치마킹합니다. 머신러닝 측면에서는 TF-IDF 특징을 활용하여 로지스틱 회귀 (Logistic Regression), 다항식 나이브 베이즈 (Multinomial Naive Bayes), 서포트 벡터 머신 (Support Vector Machine) 을 평가합니다. 딥러닝 측면에서는 파이토orch(PyTorch) 에서 구현된 양방향 장기 단기 메모리 (Bidirectional Long Short-Term Memory, BiLSTM), 게이트 순환 유닛 (Gated Recurrent Unit, GRU), 그리고 경량 트랜스포머 (lightweight Transformer) 를 비교합니다. 결과는 BiLSTM 이 89% 의 정확도와 0.89 의 가중치 F1 점수로 가장 전반적인 성능을 보였으며, 최고 수준의 머신러닝 모델인 SVM(정확도 88.11%) 을 약간 앞섰음을 보여줍니다. 이러한 발견은 전통적인 머신러닝 모델이 여전히 경쟁력이 있고 계산적으로 효율적이지만, 순서 기반의 딥러닝 모델이 텍스트 내의 문맥적 감정 단서를 더 잘 포착할 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
6

댓글

0