Perbaikan Probabilitas Lexical Model Untuk Meningkatkan Akurasi Mesin Penerjemah Statistik

Abstract

Bahasa merupakan alat komunikasi yang digunakan seseorang untuk menyampaikan ide, gagasan, konsep atau perasaan kepada orang lain. Ragam bahasa yang dimiliki setiap orang berbeda, hal ini dapat menghambat pertukaran informasi karena orang lain tidak memahami maksud dan tujuan yang ingin disampaikan. Mesin Penerjemah Statistik (Statistical Machine Translation) merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan perbaikan probabilitas lexical model pada mesin penerjemah statistik bahasa Jawa ke bahasa Indonesia untuk meningkatkan nilai akurasi hasil terjemahan. Pengujian dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan setelah perbaikan probabilitas lexical model. Penelitian menggunakan korpus paralel sebanyak 5108 korpus. Pengujian dilakukan dengan dua cara, yaitu pengujian otomatis menggunakan Bilingual Evaluation Understudy (BLEU) dan pengujian oleh ahli bahasa Jawa. Hasil dari pengujian adalah terdapat peningkatan persentase nilai BLEU sebesar 0.30% pada pengujian otomatis dan 10.69% pada pengujian oleh ahli bahasa. Kata Kunci— BLEU score, korpus paralel, lexical model, mesin penerjemah statistik.