Analisis Sentiment Tweets Berbahasa Sunda Menggunakan Naive Bayes Classifier dengan Seleksi Feature Chi Squared Statistic
Main Authors: | Cahyono, Yono, Saprudin, Saprudin |
---|---|
Other Authors: | Direktorat Riset dan Pengabdian Masyarakat Direktorat Jenderal Penguatan Riset dan Pengembangan Kementerian Riset, Teknologi, dan Pendidikan Tinggi |
Format: | Article info application/pdf Journal |
Bahasa: | ind |
Terbitan: |
Teknik Informatika Universitas Pamulang
, 2019
|
Subjects: | |
Online Access: |
http://openjournal.unpam.ac.id/index.php/informatika/article/view/3186 http://openjournal.unpam.ac.id/index.php/informatika/article/view/3186/pdf |
Daftar Isi:
- At present the development of the use of social media in Indonesia is very rapid, in Indonesia there are a variety of regional languages, one of which is the Sundanese language, where some people especially those living in West Java use Sundanese language to express comments, opinions, suggestions, criticisms and others in social media. This information can be used as valuable data for individuals or organizations in decision making. The huge amount of data makes it impossible for humans to read and analyze it manually. Sentiment analysis is the process of classifying opinions, analyzing, understanding, evaluating, emotions and attitudes towards a particular entity such as individuals, organizations, products or services, topics, events, in order to obtain information. The purpose of this research is the Naїve Bayes Classifier (NBC) classification algorithm and Feature Chi Squared Statistics selection method can be used in Sundanese-language tweets sentiment analysis on Twitter social media into positive, negative and neutral categories. Chi Square Statistic feature test results can reduce irrelevant features in the Naïve Bayes Classifier classification process on Sundanese-language tweets with an accuracy of 78.48%.
- Saat ini perkembangan penggunaan media sosial di Indonesia sangat pesat, di Indonesia terdapat berbagai bahasa daerah, salah satunya adalah bahasa Sunda, di mana sebagian orang terutama yang tinggal di Jawa Barat menggunakan bahasa Sunda untuk menyampaikan komentar, opini, saran, kritik dan lain-lain di media sosial. Informasi ini dapat digunakan sebagai data berharga bagi individu atau organisasi dalam pengambilan keputusan. Jumlah data yang sangat besar membuat manusia tidak dapat membaca dan menganalisisnya secara manual. Analisis sentimen adalah proses mengklasifikasikan pendapat, menganalisis, memahami, mengevaluasi, emosi dan sikap terhadap entitas tertentu seperti individu, organisasi, produk atau layanan, topik, peristiwa, untuk mendapatkan informasi. Tujuan dari penelitian ini adalah algoritma klasifikasi Naїve Bayes Classifier (NBC) dan metode pemilihan Fitur Chi Squared Statistics dapat digunakan dalam analisis sentimen tweets berbahasa Sunda di media sosial Twitter ke dalam kategori positif, negatif dan netral. Hasil uji fitur Chi Square Statistic dapat mengurangi fitur yang tidak relevan dalam proses klasifikasi Naïve Bayes Classifier pada tweets berbahasa Sunda dengan akurasi 78,48%.