Komparasi Algoritma Klasifikasi Machine Learning Pada Analisis Sentimen Film Berbahasa Indonesia

Main Author: Sumarno, Heny
Format: Article info application/pdf eJournal
Bahasa: eng
Terbitan: Penelitian dan Pengabdian Masyarakat Universitas Bina Insani , 2017
Online Access: http://ejournal-binainsani.ac.id/index.php/BIICT/article/view/1184
http://ejournal-binainsani.ac.id/index.php/BIICT/article/view/1184/1017
Daftar Isi:
  • Abstrak: Analisa Sentimen adalah proses yang bertujuan membedakan antara polarita diantara tiga harga yaitu positif, negatif dan netral. Opini publik adalah sumber informasi pentingyang dibutuhkan dalam pengambilan keputusan sesorang terhadap suatu produk. Saat ini, opinikonsumen terhadap pengalaman suatu produk semakin meningkat melalui media online. Untukmembaca opini-opini ini membutuhkan waktu yang banyak, tetapi jika hanya mengambil opinidalam jumlah yang sedikit dapat menimbulkan bias informasi. Algoritma Klasifikasi sepertiNaïve Bayes (NB), Support Vector Machine (SVM), dan C.45 dapat digunakan peneliti untuktujuan melakukan analisa sentimen dari opini suatu produk film. Berdasarkan hal ini, dalampenelitian ini dilakukan perbandingan dari tiga algoritma tersebut untuk mendapatkan tingkatpengetesan data yang paling tinggi. Dari penelitian ini didapat kesimpulan bahwa algoritmaNaïves Bayeslah yang mendapatkan tingkat yang paling tinggi. Setelah dilakukan kombinasiantara algoritma Naïve Bayes dan Algoritma Genetika dengan seleksi fitur untuk meningkatkantingkat akurasi dari Naïve Bayes classifier. Evaluasi selesai dilakukan dengan menggunakanmetode 10 fold cross validation. Akurasi dari tingkat pengukuran diukur dengan menggunakanconfussion matrix dan kurva ROC. Hasil akhir yang didapat dari klasifikasi text yang merupakanpenggabungan dari opini positif dan negatif menunjukan terjadi peningkatan dalam hal akurasisebesar 73 sampai dengan 80 persen pada algoritma Naïve Bayes. Kata Kunci: Algoritma Genetika, Analisa Sentimen, Machine, C4.5, Naïve Bayes, Opini,Support Vector Abstract: Sentiment analysis is the process aiming to determine whether the polarity of atowards the positive, negative or neutral. Public opinion is an important source in the decisionmakingpersontoaproduct.Nowadaysconsumersareincreasinglymakingtheiropinionsand experiencesonline.Readingthoseopinionsaretime-consuming,but,ifonlyfewopinionswere read, the evaluation would be biased. Classification algorithms such as Naive Bayes (NB),Support Vector Machine (SVM), and C4.5 were proposed by many researchers to be used insentiment analysis of movie opinions. Therefore, in this study will be to compare the third is toget agorima agoritma where most superior in the test data. So Naive Bayes algorithm generatedthe most superior. After the Naive Bayes algorithm will be combined with genetic algorithmfeature selection in order to improve the accuracy of Naive Bayes classifier. The evaluation wasdone using 10 fold cross validation. While the measurement accuracy is measured by theconfusion matrix and ROC curves. This research resulted in text classification in the form of apositive or negative opinions Indonesian language film. The results showed an increase in the accuracy of Naive Bayes 73.00% to 80.50%. Keywords: C4.5, Genetic Algorith,.Sentimetn Analysis, Naive Bayes, Opinion, Support VectorMachine.