IMPLEMENTASI FUNGSI DISPERSION RATIO PADA PROSES SPLITING ATRIBUT ALGORITMA DECISION TREE

Abstract

Metode klasifikasi yang memiliki proses seleksi fitur adalah algoritma decision tree. Proses seleksi fitur pada algortima decision tree biasanya menggunakan fungsi Information Gain. Information gainĀ  pada algoritma decision tree memiliki kelemahan jika ada dataset yang memiliki atribut key seperti Product-ID. Fungsi dispersion ratio pada algoritma decision tree dapat meningkatkan signifikansi proses seleksi fitur, sehingga dapat mengatasi kekurangan fungsi information gain. Proses splitting atribut pada decision tree menggunakan fungsi dispersion ratio dengan menggunakan dataset yang diambil dari UCI machine learning repository. Dari 7 dataset, spliting menggunakan dispersion ratio menghasilkan nilai prediksi yang lebih baik denagn rata-rata selisih nilai prediksi untuk decision tree dispersion ratio dengan decision tree information gain adalah 4.71 %.