인도네시아 제품 리뷰에 대한 감정 분석을 위한 로지스틱 회귀, SVM, LightGBM 과 BiLSTM(Attention) 벤치마킹

이커머스 플랫폼의 제품 리뷰에 대한 감정 분석은 고객 만족도를 자동으로 이해하고 제품 품질 개선을 모색하는 판매자에게 실행 가능한 통찰력을 제공하는 데 중요한 역할을 합니다. 본 논문에서는 이진 감정 분류를 위한 인도네시아 제품 리뷰에 대해 PyCaret AutoML 프레임워크를 통한 머신러닝 (ML) 접근법과 Attention 메커니즘을 갖춘 Bidirectional Long Short-Term Memory(BiLSTM) 아키텍처를 기반으로 한 딥러닝 (DL) 접근법을 비교하는 포괄적인 벤치마킹 연구를 제시합니다. 데이터셋은 긍정적 리뷰와 부정적 리뷰가 균등하게 분포된 19,728 개의 샘플로 구성됩니다. ML 접근법에서는 로지스틱 회귀 (LR), 선형 커널을 사용한 서포트 벡터 머신 (SVM), 그리고 Light Gradient Boosting Machine(LightGBM) 의 세 가지 주요 알고리즘이 10-폴드 층화 교차 검증 (10-fold stratified cross-validation) 을 통해 평가되었습니다. 로지스틱 회귀는 정확도 97.26% 와 F1-score 97.26% 를 달성하여 가장 우수한 ML 성능을 보였습니다. 3,946 개의 홀드아웃 테스트 샘플에서 평가된 Attention 이 적용된 BiLSTM 모델은 정확도 97.24% 와 F1-score 97.24% 를 달성했습니다. 이러한 비교 결과는 적절한 전처리와 특징 추출이 적용된 전통적인 ML 알고리즘이 고차원 데이터셋에서 더 복잡한 순차적 DL 아키텍처와 밀접하게 경쟁할 수 있으며, 때로는 약간 더 나은 성능을 보일 수 있음을 보여주면서도 동시에 더 높은 계산 효율성을 제공함을 시사합니다.

Insights

인도네시아 제품 리뷰에 대한 감정 분석을 위한 로지스틱 회귀, SVM, LightGBM 과 BiLSTM(Attention) 벤치마킹

요약

핵심 포인트

댓글

Claude Opus 5, Artificial Analysis 지능 리더보드 1위

Claude Code의 모든 세션을 탐색하고 재개할 수 있는 미니멀리스트 세션 브라우저를 만들었습니다

오직 공개 데이터만을 사용하여 194개의 YC Spring 2026 스타트업 점수를 매겼습니다

AI 회피 워크숍이 공공 도서관을 빅테크에 대한 저항의 장으로 만들고 있다

Claude Opus 5, Artificial Analysis 지능 리더보드 1위

Claude Code의 모든 세션을 탐색하고 재개할 수 있는 미니멀리스트 세션 브라우저를 만들었습니다

오직 공개 데이터만을 사용하여 194개의 YC Spring 2026 스타트업 점수를 매겼습니다

AI 회피 워크숍이 공공 도서관을 빅테크에 대한 저항의 장으로 만들고 있다