MESIN PENCARI AYAT AL QURAN MENGGUNAKAN INEXACT STRING MATCHING

Abstract

Dengan adanya teknologi digital, al Quran yang dahulu berupa teks manual sekarang sudah dapat dijumpai versi digitalnya. Hal tersebut memicu pengembangan perangkat lunak yang membantu mendapatkan informasi dari teks al Quran, seperti: pencarian ayat berdasarkan kata, frase maupun tema, terjemahan al Quran, tafsir al Quran. Dalam kaitannya dengan pencarian ayat berdasarkan kata atau frase, pada umumnya perangkat lunak yang ada menggunakan teknik exact string matching, yaitu teknik pencarian ayat yang sesuai dengan kata inputan secara tepat. Teknik tersebut sangat sesuai jika pemakai perangkat lunak mengetikkan kata atau frase yang akan dicari dengan benar. Tetapi jika pemakai salah dalam mengetikkan kata inputan, perangkat lunak tidak memberikan solusi atau kemungkinan-kemungkinan dari ayat yang dimaksud. Penelitian ini memadukan teknik stemming dan teknik exact string matching. Stemming berperan sebagai preprocessing untuk exact string matching. Stemming digunakan untuk menemukan kata dasar dari kata berimbuhan dengan cara menghilangkan semua imbuhan baik yang terdiri dari prefiks, sufiks, infiks, konfiks, transfiks, maupun interfiks, namun pada penelitian ini hanya menghilangkan prefiks dan sufiks saja, sebagai contoh jika kata berimbuhan adalah يسطرون maka kata dasarnya adalah سطر. Exact string matching adalah  pencocokan string secara tepat dengan susunan karakter dalam string yang dicocokkan memiliki jumlah maupun urutan karakter yang sama, sebagai contoh kata سطر akan menunjukkan kecocokan hanya dengan kata سطر. Dalam kaitannya dengan pencarian ayat, hasil stemming akan digunakan sebagai kata kunci (keyword) pencarian pada database indeks al Quran. Perpaduan tersebut dimaksudkan untuk meningkatkan hasil pencarian ayat, dan selanjutnya dapat dikategorikan sebagai teknik inexact string matching. Hasil uji coba membuktikan bahwa teknik inexact string matching dapat diimplementasikan untuk mendukung pencarian ayat al Quran dengan nilai F-measure tertinggi pada data uji coba adalah 100 % dan nilai F-measure terendah adalah 66.66 %. Uji coba juga membuktikan bahwa teknik inexact string matching lebih banyak memberikan solusi/kemungkinan dari ayat yang dimaksud dari pada teknik exact string matching. Kata kunci: Arabic Stop Word, Arabic Stemming, Exact String Matching, Inexact Matching