인도네시아 제품 리뷰 감정 분석을 위한 로지스틱 회귀, SVM, Naive Bayes 및 IndoBERT 파인튜닝 벤치마킹
요약
본 논문은 인도네시아 전자상거래 플랫폼의 제품 리뷰 데이터셋(Tokopedia)을 활용하여 감정 분석 모델을 구축하고 성능을 벤치마킹한 연구입니다. 로지스틱 회귀, SVM, Naive Bayes와 같은 전통적인 머신러닝 기법과 IndoBERT 기반 트랜스포머 모델을 비교했습니다. 실험 결과, 데이터 샘플링 방식의 차이로 인해 전통적인 Linear SVC 모델이 IndoBERT보다 높은 성능(정확도 97.60% vs 88.70%)을 보이는 것으로 나타났습니다. 연구진은 최종 모델을 Gradio 웹 애플리케이션으로 구현하여 실용적 적용 가능성을 입증했습니다.
핵심 포인트
- 인도네시아 전자상거래 리뷰 감정 분석에 전통적인 ML(Linear SVC)과 최신 트랜스포머(IndoBERT)를 비교 벤치마킹함.
- 전통적인 Linear SVC 모델이 IndoBERT보다 높은 성능을 보여, 데이터 샘플링 및 처리 방식의 차이가 결과에 큰 영향을 미칠 수 있음을 시사함.
- 클래스 불균형 문제를 해결하기 위해 가중치 기반 손실 함수와 클래스 가중치를 적용하여 모델 학습의 견고성을 높임.
- 최종 감정 분류 파이프라인을 Gradio 웹 애플리케이션으로 구현하여 실제 서비스 배포 가능성을 입증함.
인도네시아의 전자상거래 플랫폼의 지수적 성장으로 인해 사용자 생성 제품 리뷰의 양이 급증했습니다. 이러한 리뷰의 감정을 분석하는 것은 고객 만족도를 측정하고 대규모로 제품 문제를 식별하는 데 필수적입니다. 본 논문은 토키프다 (Tokopedia) 제품 리뷰 2025 데이터셋을 기반으로 세 가지 감정 분석 클래스 (긍정적, 중립적, 부정적) 를 위한 전통적인 머신러닝 (ML) 접근 방식과 트랜스포머 기반 딥러닝 모델을 벤치마크합니다. 우리는 로지스틱 회귀 (Logistic Regression), 선형 서포트 벡터 머신 (SVM), 다항 Naive Bayes를 결합하여 특징 추출을 수행하고 이를 견고한 베이스라인으로 사용했습니다. 또한, IndoBERT 모델 (indobenchmark/indobert-base-p1) 을 컨텍스트 시퀀스 분류를 위해 파인튜닝했습니다. 전자상거래 피드백에 내재된 심각한 클래스 불균형을 해결하기 위해 우리는 베이스라인 모델에 균등한 클래스 가중치를 적용하고, IndoBERT 학습 루프 내에서 커스텀 가중치 크로스 엔트로피 손실 함수를 설계했습니다. 이는 불균형 학습 연구의 광범위한 동기를 반영합니다. 종합적인 평가 결과 (정확도, Macro F1-score, Weighted F1-score) 는 전통적인 Linear SVC 모델이 실험 환경에서 IndoBERT 모델을 압도적으로 상회함을 보여주었습니다. 정확도는 97.60%로, Macro F1-score는 0.5510으로, 이는 IndoBERT의 88.70%와 0.5088에 비해 높습니다. 상세한 분석은 이 성능 격차가 데이터 샘플링 제도에 따른 불일치에 의해 주로 주도되었음을 시사합니다. 베이스라인은 전체 코퍼스를 사용했지만 트랜스포머는 샘플링된 부분집합에 제한되었습니다. 마지막으로, 우리는 최종 감정 분류 모델을 상호작용적인 Gradio 웹 애플리케이션으로 배포함으로써 파이프라인의 실용적 가능성을 입증했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기