Ekstraksi Informasi Pada Biografi Menggunakan Naïve Bayes
Daftar Isi:
- Dalam penelitian ini dibangun sebuah sistem untuk mengekstrak informasi dari sebuah dokumen biografi tokoh terkenal berbahasa Indonesia. Ekstraksi informasi berguna untuk membantu membangun database biografi terstruktur guna kepentingan penelitian lebih lanjut. Pada penelitian ini digunakan algoritma Naïve Bayes sebagai metode machine learning melalui pendekatan klasifikasi supervised. Sebelum masuk ke dalam tahap klasifikasi, data dibagi menjadi data training dimana dilakukan proses perhitungan peluang untuk mendapatkan bobot peluang tiap kelas dan data uji yang kemudian digunakan sebagai evaluasi kinerja algoritma naïve bayes. Kedua data tersebut akan melewati tahap preprocessing yang berupa tokenization, stopword removal, dan feature extraction. Pada feature extraction digunakan 7 buah fitur yang dimana berfungsi untuk mengenali ciri pada setiap kelas guna memberikan pembelajaran peluang tiap kelas pada Naïve Bayes. Pada tahap pengujian akan dilakukan pembagian porsi 80% untuk data latih dan 20% untuk data uji dan proses resampling untuk imbalance data pada kelas serta membandingkan kelas aktual dengan kelas yang diprediksi oleh sistem untuk mendapatkan nilai performansi Naïve Bayes yang terdiri dari nilai akurasi, presisi, recall, dan f-measure. Pengujian tersebut berhasil mendapatkan nilai akurasi sebesar 74,31%, presisi 53.00%, recall 73.00%, f-measure 61.41% dengan kondisi data original dan sebagai perolehan nilai tertinggi dibandingkan dengan kondisi data setelah resampling.