인도네시아어 인스타그램 댓글의 사이버 괴롭힘 탐지를 위한 AutoML 및 BiLSTM 모델 비교 분석

본 연구는 인도네시아어 인스타그램 댓글에 대한 사이버 괴롭힘 탐지를 위한 기계 학습 및 딥러닝 접근법을 비교합니다. 'Bullying(괴롭힘)'과 'Non-Bullying(비괴롭힘)'로 라벨링된 650 개의 균형 잡힌 데이터셋을 사용하여, TF-IDF 특징을 활용한 Naive Bayes, Logistic Regression, Support Vector Machine 과 BiLSTM, Bahdanau Attention 을 적용한 BiLSTM 의 성능을 평가합니다. 비공식적인 인도네시아어 텍스트에 맞춘 전처리 파이프라인이 적용되며, 이는 슬랭 정규화, 불용어 제거, 스템밍을 포함합니다. 결과는 기계 학습 모델 중 Logistic Regression 이 가장 우수한 성능을 보였으며, 딥러닝 모델 중 BiLSTM with Attention 이 전반적으로 가장 강력한 성능을 달성했습니다. 본 연구의 발견은 도메인 특화 전처리의 가치를 강조하고, 딥러링이 문맥적 패턴을 더 효과적으로 포착할 수 있음에도 불구하고 기계 학습이 리소스 제약이 있는 배포 환경에서도 경쟁력 있는 옵션임을 보여줍니다.

Insights

인도네시아어 인스타그램 댓글의 사이버 괴롭힘 탐지를 위한 AutoML 및 BiLSTM 모델 비교 분석

요약

핵심 포인트

댓글

Codex가 이제 Claude Code의 메모리를 읽을 수 있습니다

Lip-Bu Tan 체제 하의 Intel 파운드리, 첫 외부 고객사 확보. 실적 발표 2일 전 주가 8% 이상 급등

Claude가 이제 어떤 웹사이트의 인터페이스도 직접 복제할 수 있습니다

AI를 상당히 사용하고 있음에도 AI 활용 설문에서는 낮은 점수였다──제2세대 AI 인재라는 생각

Codex가 이제 Claude Code의 메모리를 읽을 수 있습니다

Lip-Bu Tan 체제 하의 Intel 파운드리, 첫 외부 고객사 확보. 실적 발표 2일 전 주가 8% 이상 급등

Claude가 이제 어떤 웹사이트의 인터페이스도 직접 복제할 수 있습니다

AI를 상당히 사용하고 있음에도 AI 활용 설문에서는 낮은 점수였다──제2세대 AI 인재라는 생각