Twitter Sentiment Analysis using Na ̈ive Bayes Classifier with Mutual Information Feature Selection
Main Authors: | Ulfa, Maria Arista, Irmawati, Budi, Husodo, Ario Yudo |
---|---|
Format: | Article info application/pdf Journal |
Bahasa: | eng |
Terbitan: |
Informatics Engineering Dept., Faculty of Engineering, University of Mataram
, 2018
|
Subjects: | |
Online Access: |
https://jcosine.if.unram.ac.id/index.php/jcosine/article/view/120 https://jcosine.if.unram.ac.id/index.php/jcosine/article/view/120/26 |
Daftar Isi:
- Sentiment analysis is an identification technique of emotion expressed in texts. Thesentiment analysis goal is to determine a negative or positive opinion within a sentenceor a document. Twitter is one of social medias to convey an opinion. The twitter allowsits users to write opinions related to a specific topic in a tweet. The twitter data used inthis research was downloaded using the twitter Application Programming Interface (API).It consisted 500 tweets about Lombok tourism that contained #lombok and#woderfullombok hashtags. The features extracted from the twitter data were selectedusing the Mutual Information (MI) method then they were analyzed using the NaïveBayes Classifier (NBC) model. The evaluation of sentiment analysis on the Lomboktourism twitter data in a 10-folds cross validation resulted 97.9% accuracy.Key words : Sentiment Analysis, Twitter, Naïve Bayes Classifier, Mutual Information.
- Analisis sentimen merupakan suatu teknik idetifikasi terhadap emosi yangdiekspresikan melalui teks. Tujuan analisis sentimen adalah menentukan apakah suatupendapat dalam kalimat atau dokumen termasuk kategori positif ataunegatif. Twitter merupakan salah satu media sosial yang sering digunakan dalammenyampaikan pendapat. Twitter memungkinkan penggunanya (user) untuk menulispendapat mereka mengenai berbagai topik dalam sebuah tweet. Data twitter dalampenelitian ini didownload melalui twitter Application Programming Interface (API).Data twitter tersebut terdiri dari 500 tweet tentang pariwisata Lombok dengan hashtag#lombok dan #woderfullombok. Fitur informasi dari setiap tweet diseleksimenggunakan metode Mutual Information dan dianalisis menggunakan modelklasifikasi Naïve Bayes (Naïve Bayes Classifier). Hasil pengujian klasifikasisentimen twitter pada kategori positif dan negatif menggunakan 10-fold crossvalidation memperoleh akurasi rata-rata sebesar 97,9%.Kata kunci : Analisis Sentimen, Twitter, Naïve Bayes Classifier, Mutual Information