본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 01. 16:15

기계 학습 및 트랜스포머 기반 모델을 활용한 인도네시아 고등교육 분야 AI 도입에 대한 감정 분석

요약

본 연구는 인도네시아 고등교육 분야의 AI 도입에 대한 학생들의 의견을 분석하기 위해 기계 학습(ML)과 트랜스포머 기반 딥러닝 두 가지 접근법을 비교했습니다. 데이터셋은 총 2,295개의 레이블링된 샘플로 구성되었으며, LightGBM, Random Forest, SVM 등의 ML 모델과 DistilBERT 같은 트랜스포머 모델이 사용되었습니다. 분석 결과, 전반적으로 트랜스포머 기반의 DistilBERT가 가장 높은 성능을 보였으나, 전통적인 기계 학습 모델 중에서는 SVM이 효과적이고 경쟁력 있는 대안임을 입증했습니다.

핵심 포인트

  • 인도네시아 고등교육 분야 AI 도입에 대한 학생 의견 분석에 ML과 트랜스포머 모델 비교 적용.
  • ML 모델(LightGBM, RF, SVM) 중에서는 SVM이 가장 높은 성능을 기록하여 효율적인 대안임을 입증함.
  • 트랜스포머 기반 모델(DistilBERT)은 문맥 정보 포착 능력이 뛰어나 전반적으로 가장 우수한 성능을 달성함.
  • 연구 결과는 트랜스포머의 우수성을 보여주지만, SVM과 같은 전통적인 ML 기법도 여전히 강력한 감정 분류 도구임을 시사함.

본 연구는 두 가지 접근법, 즉 TF-IDF 기반 기계 학습과 트랜스포머 기반 딥러닝을 활용하여 인도네시아 학생들의 고등교육 분야에서 인공지능(AI) 도입에 대한 의견을 분석합니다. 데이터셋은 1,154 건의 학생 의견과 추가적인 어휘 감정 데이터를 결합한 총 2,295 건의 레이블이 지정된 샘플로 구성됩니다. 기계 학습 모델로는 LightGBM, Random Forest, 그리고 Support Vector Machine (SVM) 이 평가되었으며, DistilBERT 는 이진 감정 분류를 위해 미세 조정(fine-tuned)되었습니다. 결과는 SVM 이 기계 학습 모델들 중에서 가장 높은 성능을 보였으며, 테스트 정확도는 82.14%, F1-score 는 82.14% 를 기록했습니다. 반면, DistilBERT 는 전체적으로 가장 우수한 성능을 발휘하여 정확도 84.78%, F1-score 84.75% 를 달성했습니다. 이러한 결과는 트랜스포머 기반 모델이 문맥 정보를 더 잘 포착할 수 있음을 시사하지만, SVM 도 감정 분류를 위한 경쟁력 있고 효율적인 대안임을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
4

댓글

0