PERINGKASAN TEKS OTOMATIS BERITA BERBAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE

Abstract

Perkembangan teknologi internet berdampak bertambahnya jumlah situs berita berbahasa Indonesia dan menciptakan  ledakan informasi. Hal tersebut menuntut semua informasi bisa diakses dengan cepat dan tidak harus membutuhkan banyak waktu dalam membaca sebuah headline berita.Teknologi peringkas teks otomatis menawarkan solusi untuk membantu pencarian isi berita berupa deskripsi singkat (summary). Penelitian dia­wali dengan lima tahap text preprocessing: pemecahan kalimat,case folding, tokenizing, filtering, dan stemming. Proses selanjutnya menghitung bobot tf-idf, bobot query relevance dan bobot similarity. Ringkasan dihasilkan dari ekstraksi kalimat dengan menggunakan metode maximum marginal relevance. Metode ekstraksi maximum marginal relevance me­rupakan metode yang digunakan untuk mengurangi redudansi dalam perangkingan kali­mat pada multi dokumen. Data uji coba diambil dari surat kabar berbahasa Indonesia on-line sejumlah 30 berita. Hasil pengujian dibandingkan dengan ringkasan manual yang menghasilkan rata-rata recall  60%, precision 77%, dan f-measure 66%.  Kata kunci: peringkasan, text preprocessing, tf-idf, query relevance, similarity, maximum marginal relevance