Klasifikasi Dokumen Menggunakan Support Vector Machine Dan Mutual Information
Daftar Isi:
- Klasifikasi dokumen adalah proses pengelompokan dokumen kedalam satu kategori yang memiliki fitur kata yang sama. Penelitian ini akan mengklasifikasi dokumen abstrak tugas akhir berdasarkan machine learning menggunakan Support Vector Machine (SVM) dan seleksi fitur berupa Mutual Information (MI). Seleksi fitur Mutual Information (MI) digunakan untuk dapat menentukan suatu kata yang menjadi ciri khas atau kata unik yang digunakan dalam dokumen abstrak tugas akhir yang akan diklasifikasikan. Tujuannya agar klasifikasi dokumen abstrak menggunakan Support Vector Machine (SVM) dapat menghasilkan akurasi yang lebih baik. Tahapan yang dilakukan diantaranya preprocessing, pembobotan tf-idf, seleksi fitur Mutual Information (MI) dan klasifikasi untuk menentukan kategori dokumen abstrak tugas akhir. Pengujian dilakukan dengan cara membandingkan klasifikasi dengan proses seleksi fitur Mutual Information (MI) maupun tanpa seleksi fitur. Hasil pengujian untuk penggunaan Mutual Information (MI) didapatkan akurasi sebesar 94%, dan tanpa penggunaan Mutual Information (MI) sebesar 94%. Berdasarkan hasil ini disimpulkan bahwa penggunaan seleksi fitur Mutual Information (MI) pada klasifikasi dokumen abstrak tidak memiliki perbedaan yang signifikan.