Naive Bayes classifier optimization for text classification on e-government using particle swarm optimization

Main Authors: Nugroho, Kuncahyo Setyo, Istiadi, Istiadi, Marisa, Fitri
Other Authors: University Widyagama of Malang, Indonesia, Universitas Widyagama, Indonesia
Format: Article info application/pdf eJournal
Bahasa: ind
Terbitan: Departemen Teknik Komputer, Fakultas Teknik, Universitas Diponegoro , 2020
Subjects:
Online Access: https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13362
https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13362/12539
https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/downloadSuppFile/13362/374
Daftar Isi:
  • One of the public e-government services is a web-based online complaints portal. Text of complaint needs to be classified so that it can be forwarded to the responsible office quickly and accurately. The standard classification approach commonly used is the Naive Bayes Classifier (NBC) and k-Nearest Neighbor (k-NN), which still classifies one label and needs to be optimized. This research aims to classify the complaint text of more than one label at the same time with NBC, which is optimized using Particle Swarm Optimization (PSO). The data source comes from the Sambat Online portal and is divided into 70 % as training data and 30 % as testing data to be classified into seven labels. NBC and k-NN algorithms are used as a comparison method to find out the performance of PSO optimization. The 10-fold cross-validation shows that NBC optimization using PSO achieves an accuracy of 87.44 % better than k-NN of 75 % and NBC of 64.38 %. The optimization model can be used to increase the effectiveness of services to e-government in society.
  • Salah satu bentuk e-government adalah portal pengaduan online berbasis web. Teks pengaduan perlu diklasifikasikan sehingga dapat diteruskan ke dinas yang bertanggung jawab dengan cepat dan akurat. Pendekatan klasifikasi standar yang umum digunakan adalah Naive Bayes Classifier (NBC) dan k-Nearest Neighbor (k-NN) yang masih mengklasifikasikan satu label dan perlu dioptimasi. Penelitian ini bertujuan mengklasifikasi teks pengaduan lebih dari satu label sekaligus dengan NBC yang dioptimalkan menggunakan Particle Swarm Optimization (PSO). Sumber data berasal dari portal Sambat Online dan dibagi menjadi 70 % sebagai data latih dan 30 % sebagai data uji untuk diklasifikasikan ke dalam tujuh label. Algoritma NBC dan k-NN digunakan sebagai metode pembanding untuk mengetahui kinerja optimasi PSO. Hasil pengujian menggunakan 10-fold cross-validation menunjukkan bahwa optimasi NBC menggunakan PSO mencapai akurasi sebesar 87,44 % yang lebih baik dari k-NN sebesar 75 % dan NBC 64,38 %. Model optimasi ini diharapkan dapat meningkatkan efektifitas layanan e-government pada masyarakat.