Analisis Daya Beda Soal, Taraf Kesukaran, Validitas Butir Tes, Interpretasi Hasil Tes dan Validitas Ramalan dalam Evaluasi Pendidikan
Abstract
Daya beda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang pintar (berkemampuan rendah). Angka yang menunjukkan besarnya daya beda disebut indeks diskriminasi, yang mana berkisar antara 0,00 sampai 1,00. Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya terlalu mudah. Validitas ramalan (predictive validity) merupakan suatu tes yang diharapkan mampu meramalkan keberhasilan studi para calon mahasiswa dalam mengikuti program pendidikan di suatu perguruan tinggi pada masa-masa yang akan datang. Adapun yang menjadi permasalahan di sini adalah bagaimana cara yang dapat ditempuh agar kita dapat sampai pada kesimpulan bahwa suatu tes telah memiliki validitas ramalan? Analisis soal sesungguhnya bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan “petunjuk” untuk mengadakan perbaikan dalam pembelajaran. Kualitas tes dan butir soal sangat ditentukan oleh: (1) validitas, (2) reliabilitas, (3) objektivitas, (4) praktikabilitas, (5) daya pembeda, (6) taraf atau derajad kesukaran, (7) efektivitas pilihan, dan (8) efisiensi.What is meant here is the ability of the question to distinguish between clever students and not-clever students. Figures indicating the magnitude of discriminating ability are called discriminative indices, which range from 0.00 to 1.00. Numbers that indicate difficult and easy questions are called difficulty indexes. The magnitude of the index of difficulty between 0.00 to 1.0. This difficult index indicates the difficulty level of the question. Questions with a .07 difficult index suggest that the question is too difficult, otherwise index 1.0 indicates that the question is too easy. Predictive validity is a test that is expected to predict the success of the study of students in following the education program in college in the future. As for the problem here is how do we get to the conclusion that a test has had the validity of the prediction? Question analysis aims to identify good and bad questions. The analysis of the questions obtained informations about the badness of questions and “guidance” to make improvements in learning. The quality of tests and questions is largely determined by: (1) validity, (2) reliability, (3) objectivity, (4) practice, (5) distinguishing ability, (6) level or degree of difficulty, (7) effective option (8) efficiency.