Sentiment Analysis on KAI Twitter Post Using Multiclass Support Vector Machine (SVM)
Main Authors: | Dhina Nur Fitriana, Yuliant Sibaroni |
---|---|
Format: | Article info application/pdf Journal |
Bahasa: | eng |
Terbitan: |
Ikatan Ahli Informatika Indonesia (IAII)
, 2020
|
Subjects: | |
Online Access: |
http://jurnal.iaii.or.id/index.php/RESTI/article/view/2231 http://jurnal.iaii.or.id/index.php/RESTI/article/view/2231/314 |
Daftar Isi:
- Information in form of unstructured texts is increasing and becoming commonplace for its existence on the internet. This information is easily found and utilized by business people or companies through social media. One of them is Twitter. Twitter is ranked 6th as a social media that is widely accessed today. The use of Twitter has the disadvantage of unstructured and large data. Consequently, it is difficult for business people or companies to know opinion towards service with limited resources. To Make it easier for businesses know the public's sentiment for better service in the future, public sentiment on Twitter needs to be classified as positive, neutral, and negative. The Multiclass Support Vector Machine (SVM) method is a supervised learning classification method that handles three classes classification. This paper uses One Against All (OAA) approach as a method to determine the class. This paper contains the results of classifying OAA Multiclass SVM methods with five different weighting features unigram, bigram, trigram, unigram+ bigram, and word cloud for analyzing tweet data, finding the best accuracy and important feature when processed with large data. The highest accuracy is the unigram TF-IDF model combined with the OAA Multiclass SVM with gamma 0.7 is 80.59.
- Informasi dalam bentuk dokumen berbasis teks yang tidak terstruktur semakin meningkat dan menjadi biasa bagi keberadaannya di internet. Informasi ini mudah ditemukan dan digunakan oleh pelaku bisnis atau perusahaan melalui media sosial. Salah satunya media sosial diantaranya Twitter. Twitter berada di peringkat ke-6 sebagai media sosial yang banyak diakses saat ini. Penggunaan Twitter memiliki kelemahan yaitu data yang tidak terstruktur dan berjumlah besar. Akibatnya, sulit bagi pebisnis atau perusahaan untuk mengetahui pendapat terhadap layanan dengan sumber daya terbatas. Agar lebih mudah bagi bisnis untuk mengetahui respons publik terhadap layanan yang lebih baik di masa depan, sentimen publik di Twitter perlu diklasifikasikan sebagai positif, netral, dan negatif. Metode Multiclass Support Vector Machine (SVM) adalah metode klasifikasi pembelajaran terawasi yang menangani klasifikasi tiga kelas. Makalah ini menggunakan pendekatan One Against All (OAA) sebagai metode untuk menentukan kelas. Makalah ini berisi hasil mengklasifikasikan metode SVM Multi-kelas OAA dengan lima fitur pembobotan yang berbeda, unigram, bigram, trigram, unigram + bigram, dan wordcloud untuk menganalisis sentimen data tweet, menemukan akurasi terbaik dan fitur penting ketika diproses dengan data besar. Akurasi tertinggi adalah model TF-IDF unigram yang dikombinasikan dengan OAA Multi-class SVM dengan gamma 0.7 adalah 80.59.