Implementasi Algoritma Multinomial Naive Bayes untuk Spam Filtering pada User Feedback
Main Author: | Mudhiya Sadid, Septiyan |
---|---|
Format: | Thesis NonPeerReviewed application/pdf |
Bahasa: | eng |
Terbitan: |
, 2020
|
Subjects: | |
Online Access: |
http://kc.umn.ac.id/14897/1/HALAMAN_AWAL.pdf http://kc.umn.ac.id/14897/2/DAFTAR_PUSTAKA.pdf http://kc.umn.ac.id/14897/3/BAB_I.pdf http://kc.umn.ac.id/14897/4/BAB_II.pdf http://kc.umn.ac.id/14897/5/BAB_III.pdf http://kc.umn.ac.id/14897/6/BAB_IV.pdf http://kc.umn.ac.id/14897/7/BAB_V.pdf http://kc.umn.ac.id/14897/8/LAMPIRAN.pdf http://kc.umn.ac.id/14897/ |
Daftar Isi:
- User feedback dapat memberikan informasi yang dapat membantu developer untuk melakukan perbaikan ataupun pengembangan pada software. Meski begitu, terdapat banyak feedback yang tergolong sebagai spam. Pada user feedback, spam lebih mengarah kepada inappropriate feedback, yaitu feedback yang sebenarnya bukanlah merupakan ulasan ataupun saran namun hanya komentar jahil atau sekadar pertanyaan. Membaca dan memilih feedback yang berguna secara manual akan memakan banyak waktu dan tenaga. Oleh karena itu, sistem spam filtering menggunakan Multinomial Naive Bayes yang mengimplementasikan TF/IDF dibuat agar dapat membantu untuk mengurangi spam yang terdapat pada feedback. Pada klasifikasi teks, algoritma Multinomial Naive Bayes terbukti unggul dalam hal kecepatan dan memiliki performa yang bagus. Dengan TF/IDF, kata yang sangat sering muncul dalam banyak dokumen akan berkurang bobotnya sehingga dapat membantu dalam meningkatkan performa pada dataset yang tidak seimbang. Penelitian ini bertujuan mengimplementasikan algoritma multinomial naive bayes untuk spam filtering pada user feedback serta mengetahui akurasi dan performa dari model yang dibuat. Hasil uji coba yang memiliki performa terbaik pada penelitian ini diperoleh ketika menggunakan metode upsampling serta typo corrector dengan perbandingan train dan test set sebesar 70:30, yaitu akurasi sebesar 89,25%, precision sebesar 45%, recall sebesar 56%, dan F1-Score 50%.