Klasifikasi Berita Menggunakan Metode Support Vector Machine

Abstract

Abstrak - Berita adalah sebuah informasi mengenai peristiwa yang terjadi di suatu lokasi yang bisa disajikan dalam bentuk teks maupun visual. Berita bisa ditemukan di berbagai portal berita dan media cetak. Umumnya setiap berita dikelompokan berdasarkan kategori umum seperti ekonomi, politik, olahraga, dll. Permasalahan yang muncul adalah  bagaimana cara untuk melakukan pengelompokan pada data berita yang biasanya berjumlah hingga ribuan karakter kedalam kategori yang lebih spesifik. Permasalah ini dapat diselesaikan dengan cara menerapkan text mining dengan memanfatakan algoritma klasifikasi untuk mendapatkan sebuah model fungsi yang merepresentasikan tiap kategori berita. Salah satu algoritma klasifikasi yang cukup tangguh untuk melakukan proses klasifikasi teks adalah Support Vector Machine. Penelitian ini menggunakan 510 data berita dengan batasan klasifikasi 3 kategori berita. Algoritma SVM mendapatkan hasil akurasi tertinggi di 88% untuk nilai parameter C =1, kernel Linear dengan pembagian data uji dan data latih sebesar 90% dan 10 %.Kata kunci : Berita, Klasifikasi, Support Vector Machine, Text Mining Abstract  - News is information about events that occur in a location that can be presented in text or visual form. News can be found on various news portals and print media.Generally each news is grouped by general categories such as economics, politics, sports, etc. The problem is how to group news data into more specific categories.This problem can be solved by applying text mining using the classification algorithm to obtain a function model that represents each news category. One of the classification algorithms that is strong enough to do the text classification process is the Support Vector Machine. This study uses 510 news sample with a classification limit of 3 news categories. The SVM algorithm gets the highest accuracy at 88% for the parameter value C = 1, and Linear kernel with the distribution of test data and training data is 90% and 10%.Keywords : Classification, News, Support Vector Machine, Text Mining