PERBANDINGAN NAÏVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI JUDUL ARTIKEL

Abstract

Support Vector Machine (SVM) dan Naïve Bayes Classifier (NBC) merupakan dua algoritma yang sangat polpuler untuk text mining, khususnya untuk klasifikasi teks. Pada penelitian-penelitian sebelumnya SVM cenerung menghasilkan performa yang lebih baik dari NBC pada segi akurasi hasil klasifikasi. Salah satu hal yang menarik dari penelitian-penelitian sebelumnya adalah penggunaan jenis data yang hamper sama antara satu dengan lainnya. Penelitian-penelitian sebelumnya kebanyakan menggunakan data tweet dari situs Twitter. Data tweet merupakan jenis teks yang informal dengan banyak sekali noise dan tidak mengindahkan aturan tata bahasa. Pada penelitian kali ini, akan algoritma SVM dan NBC akan diujicobakan kedalam data teks yang lebih formal, yakni data dari judul-judul artikel. Dalam percobaan yang sudah dilakukan, didapatkan hasil yang berbeda dengan penelitian sebelumnya. Pada klasifikasi teks judul artikel NBC memiliki performa akurasi yang lebih baik jika dibandingkan dengan SVM.