IMPLEMENTASI FUNGSI DISPERSION RATIO PADA PROSES SPLITING ATRIBUT ALGORITMA DECISION TREE
Abstract
Metode klasifikasi yang memiliki proses seleksi fitur adalah algoritma decision tree. Proses seleksi fitur pada algortima decision tree biasanya menggunakan fungsi Information Gain. Information gainĀ pada algoritma decision tree memiliki kelemahan jika ada dataset yang memiliki atribut key seperti Product-ID. Fungsi dispersion ratio pada algoritma decision tree dapat meningkatkan signifikansi proses seleksi fitur, sehingga dapat mengatasi kekurangan fungsi information gain. Proses splitting atribut pada decision tree menggunakan fungsi dispersion ratio dengan menggunakan dataset yang diambil dari UCI machine learning repository. Dari 7 dataset, spliting menggunakan dispersion ratio menghasilkan nilai prediksi yang lebih baik denagn rata-rata selisih nilai prediksi untuk decision tree dispersion ratio dengan decision tree information gain adalah 4.71 %.