Daftar Isi:
  • Ekstraksi informasi merupakan salah satu dari cabang text mining yang bertujuan untuk mengambil informasi dari teks yang tidak terstruktur menjadi data yang terstruktur. Ekstraksi informasi dokumen yang menggunakan klasifikasi rule-based memiliki masalah penurunan akurasi pada karakteristik dokumen yang tidak identik. Oleh karena itu, penelitian ini menggunakan machine learning Fuzzy K-Nearest Neighbour (Fuzzy K-NN) sebagai klasifikasi ekstraksi informasi dokumen. Dokumen yang digunakan dalam penelitian ini adalah surat masuk. Tujuan penelitian ini adalah untuk menganalisis bagaimana tingkat performa klasifikasi Fuzzy K-NN dalam ekstraksi informasi surat masuk yang memiliki karakteristik data tidak identik dan membandingkan tingkat akurasi dengan klasifikasi K-NN. Penelitian ini menggunakan praproses converting, filtering, tagging dan tokenization, serta menggunakan boolean weighting sebagai metode pembobotan. Ekstraksi fitur yang digunakan memiliki 11 parameter. Pengujian yang dilakukan menggunakan pengujian black box dan perhitungan akurasi dengan confusion matrix. Hasil analisis pengujian akurasi menunjukkan bahwa nilai akurasi klasifikasi Fuzzy K-NN lebih baik daripada klasifikasi K-NN dengan 87,52 % berbanding 85,17%. Berdasarkan hasil tersebut, disimpulkan algoritma Fuzzy K-NN dapat diterapkan menjadi klasifikasi dalam ekstraksi informasi dokumen surat masuk.