Klasifikasi Berita Berbahasa Indonesia Mengggunakan Seleksi Fitur Dua Tahap Dan Naïve Bayes
Abstract
Jumlah dokumen digital telah meningkat secara pesat, sehingga klasifikasi dokumen secara otomatis menjadi sangat penting. Pemilihan fitur diperlukan dalam klasifikasi dokumen otomatis. Salah satu metode seleksi fitur yang terbukti handal adalah Maximal Marginal Relevance for Feature Selection (MMR-FS), namun metode ini memiliki kompleksitas yang tinggi. Dalam penelitian ini, diusulkan sebuah metode baru dalam pemilihan fitur untuk klasifikasi dokumen. Metode yang diusulkan terdiri dari dua tahap, yang pertama adalah Information Gain dan yang kedua adalah MMR-FS . Pada proses klasifikasinya digunakan metode Naïve Bayes. Dalam percobaan yang dilakukan, metode yang diusulkan bisa mencapai akurasi 86%. Metode baru ini dapat menurunkan kompleksitas MMR-FS namun tetap mempertahankan keakuratannya.