Klasifikasi Berita Menggunakan Metode K-Nearest Neighbor

Abstract

Abstrak - Meningkatnya minat masyarakat dalam mengakses berita, khususnya berita online, menuntut redaktur dan situs portal berita untuk memberikan liputan dan berita yang berkualitas. Selain itu, klasifikas berita yang ada masih tergolong umum dapat menjadi kendala yang dialami pembaca. jika pembaca ingin melihat kategori berita yang lebih spesifik, mereka harus menyaring berita tersebut secara manual. Hal ini juga terjadi di bidang sosial Badan Pusat Statistik Provinsi Riau yang kesulitan mencari berita tentang Provinsi Riau. Oleh karena itu, proses klasifikasi berita menggunakan metode k-nearest neighbor menjadi hal yang krusial untuk dilakukan. Jumlah berita yang digunakan dalam penelitian ini berjumlah 510 data dengan tiga kategori yaitu demokrasi, kemiskinan, dan ketenagakerjaan. Proses klasifikasi berita dalam penelitian ini meliputi: pengumpulan data, pelabelan manual, preprocessing teks, pembobotan kata, dan klasifikasi memakai metode k-nearest neighbor. Selain itu, cosinus similarity juga digunakan untuk meningkatkan nilai akurasi. Nilai akurasi tertinggi yang diperoleh pada penelitian ini adalah 87% menggunakan nilai k = 3 dengan distribusi data uji 20% & dan data latih dari 80%. Dari penelitian ini dapat diambil kesimpulan bahwa metode K-Nearest Neighbor dapat bekerja dengan baik dalam proses klasifikasi berita.Kata kunci: Badan Pusat Statistik, Berita, Cosine Similarity, Klasifikasi, K-Nearest Neighbor Abstract - The increasing of public interest in accessing news, especially online news, requires editors and news portal sites to provide quality coverage and news. In addition, the grouping of news that still classified as a general can be an obstacle experienced by readers. if the reader wants to see a more specific category of news, they must filter the news manually. This is also happened in the social sector of Badan Pusat Statistik Provinsi Riau, which has trouble when finding news about Riau Province. Therefore, the news classification process using the k-nearest neighbor method is a crucial thing to do. The number of news stories used in this study amounted to 510 data with three categories,  democracy, poverty, and employment. The news classification process in this study includes: data collection, manual labeling, text preprocessing, word weighting, and classification using k-nearest neighbor method. Besides that, cosine similarity is also used to increase the accuracy value. The highest accuracy values obtained in this study were 87% using a values of k = 3 with distribution of test data of 20% & and training data of 80%. From this research, it can be concluded that the K-Nearest Neighbor method works well in the news classification process.Keywords: Badan Pusat Statistik, Cosine Similarity, Classification, K-Nearest Neighbor, News