Perbandingan Metode Lexicon-based dan SVM untuk Analisis Sentimen Berbasis Ontologi pada Kampanye Pilpres Indonesia Tahun 2019 di Twitter

Abstract

<p class="AbstractTitle"><strong>Abstrak</strong></p><p class="BodyAbstract">Penggunaan media sosial semakin hari semakin meningkat. Salah satu media sosial yang popular saat ini adalah Twitter. Menjelang pemilihan Presiden Republik Indonesia semakin banyak tweet yang membahas tentang kegiatan tersebut. Hal ini menyebabkan topik kampanye pemilu memiliki peluang yang baik untuk dilakukan proses analisis sentimen. Saat ini, mayoritas analisis sentimen di Indonesia dilakukan hanya menilai sentimen dari kalimat tanpa mengetahui apa entitas yang ada dalam kalimat. Tujuan penelitian ini yaitu melakukan analisis sentimen dengan pendekatan berbasis ontologi. Ontologi digunakan dalam menyaring data yang akan digunakan. Ontologi dalam penelitian ini adalah ekonomi dengan atribut finansial, lapangan kerja, dan kesejahteraan. Proses analisis sentimen dilakukan dengan metode Lexicon-based dan Support Vector Machine (SVM). Proses akuisisi data diperoleh sejumlah 700.000 tweet. Koleksi tersebut diseleksi berdasarkan ontologi ekonomi menghasilkan 16.998 tweet dan dilakukan pelabelan manual sebanyak 1.600. Kemudian dilakukan pengolahan data hingga diperoleh dataset final sejumlah 1.050 tweet. Berdasarkan hasil penelitian yang dilakukan akurasi yang diperoleh berdasarkan metode Lexicon-based adalah 39% dan metode SVM sebesar 83%. Dari penelitian ini diketahui bahwa SVM mempunyai performa yang lebih baik dibandingkan dengan Lexicon-based. Hasil Lexicon-based menunjukkan bahwa sentimen pada mayoritas atribut berupa netral. Sedangkan hasil SVM menunjukkan bahwa sentimen pada mayoritas atribut (finansial dan kesejahteraan) berupa positif, sisanya (lapangan kerja) berupa netral. Selanjutnya, proses ekstraksi dan pembuatan ontologi Bahasa Indonesia secara semi-otomatis pada dataset perlu untuk dikembangkan pada penelitian berikutnya untuk menyempurnakan ontologi.</p><p class="BodyAbstract"><strong>Kata kunci</strong><strong>: </strong>Analisis Sentimen, Twitter, Ontology, SVM, Lexicon</p><p class="BodyAbstract"> </p><p class="AbstractTitle"><strong>Abstract</strong></p><p class="BodyAbstract"><strong>[Comparison of the Lexicon-based and SVM Method for Ontology-Based Analysis of the 2019 Presidential Election Campaign on Twitter]</strong> The use of social media is increasing. One of the most popular social media is Twitter. Towards the election of the President of the Republic of Indonesia, election topic tweets discussed almost every day. Hence, it is suitable for the sentiment analysis process. Nowadays, the sentiment analysis is only evaluating the sentence without knowing what the entity is in the sentence. To overcome this drawback, we propose a sentiment analysis based on ontology. Ontology is used to filter the data to be used. The ontology used in this study is economics with attributes, i.e., financial employment, and welfare. The sentiment analysis process is carried out using the Lexicon and Support Vector Machine (SVM) based methods. The process of acquiring data obtained 700,000 tweets. The collection was selected based on economic ontology to produce 16,998 tweets, and 1,600 manual labels were labelled. Then, the number of the final dataset is 1,050 tweets. The results show that the accuracy of the Lexicon-based method is 39%, and the SVM method is 83%. The SVM has better performance than Lexicon-based. Lexicon-based results show that the sentiment on the majority attributes is neutral. While the SVM results show that the sentiment on the majority attributes (financial and welfare) is positive, the rest (employment) is neutral. <em>A semi-automatic ontology extraction and development for Bahasa Indonesia is necessary for the future works to make a comprehensive ontology and provide better results</em>.</p><p class="BodyAbstract"> </p><p class="BodyAbstract"><strong>Keywords</strong><strong>:</strong> Sentiment Analysis, Twitter, Ontology, SVM, Lexicon</p>