Application of SMOTE in Sentiment Analysis of MyXL User Reviews on Google Play Store

Abstract

Aplikasi di dunia nyata sering kali memiliki kumpulan data teks yang tidak seimbang, yang menyebabkan hasil prediksi algoritma klasifikasi menjadi bias terhadap kelas mayoritas dan mengabaikan kelas minoritas. Akurasi yang tinggi tidak mencerminkan kinerja yang sebenarnya. Penelitian ini menggunakan teknik SMOTE untuk menyeimbangkan kelas dalam analisis sentimen menggunakan kumpulan data ulasan pengguna MyXL dari Google PlayStore. Kami membandingkan kinerja algoritma Regresi Logistik dan Support Vector Machine dengan data yang tidak seimbang dan data yang seimbang dari SMOTE. Fitur teks diekstraksi menggunakan TF-IDF, dan metrik evaluasi didasarkan pada akurasi, presisi, recall dan skor F1, yang dioptimalkan melalui GridSearchCV di Scikit-learn. Kinerja terbaik dicapai dengan menerapkan SMOTE ke algoritma SVM, yang menghasilkan akurasi 73,00%, presisi 67,13%, recall 65,82% dan skor F1 66,30%.