Ekstraksi Dokumen Buku Menggunakan K-Nearest Neighbours

Main Author: Mauladi, Ilham Agusta
Format: Thesis NonPeerReviewed Book eArticle
Bahasa: eng
Terbitan: , 2020
Subjects:
Online Access: http://elibrary.unikom.ac.id/id/eprint/2960/1/1.%2010113401_ILHAM%20AGUSTA%20MAULADI_COVER.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/2/18.%2010113401_ILHAM%20AGUSTA%20MAULADI_LEMBAR%20PENGESAHAN.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/3/22.%2010113401_ILHAM%20AGUSTA%20MAULADI_SURAT%20KETERANGAN%20PERSETUJUAN%20PUBLIKASI.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/4/19.%2010113401_ILHAM%20AGUSTA%20MAULADI_SURAT%20KETERANGAN%20ORISINALITAS.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/5/4.%2010113401_ILHAM%20AGUSTA%20MAULADI_KATA%20PENGANTAR.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/6/5.%2010113401_ILHAM%20AGUSTA%20MAULADI_DAFTAR%20ISI.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/7/11.%2010113401_ILHAM%20AGUSTA%20MAULADI_BAB%201.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/8/12.%2010113401_ILHAM%20AGUSTA%20MAULADI_BAB%202.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/9/13.%2010113401_ILHAM%20AGUSTA%20MAULADI_BAB%203.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/10/14.%2010113401_ILHAM%20AGUSTA%20MAULADI_BAB%204.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/11/15.%2010113401_ILHAM%20AGUSTA%20MAULADI_BAB%205.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/12/10.%2010113401_ILHAM%20AGUSTA%20MAULADI_DAFTAR%20PUSTAKA.pdf
http://elibrary.unikom.ac.id/id/eprint/2960/
http://elibrary.unikom.ac.id
Daftar Isi:
  • Dalam text mining, ekstraksi informasi adalah salah satu cabang yang penelitiannya berkembang dengan pesat. Banyak metode dan pengaplikasian dari ekstraksi informasi seperti pada surat masuk, berita, dan identitas buku. Maka dari itu, dalam penelitian kali ini akan dilakukan ekstraksi informasi menggunakan metode K-Nearest Neighbour yang merupakan salah satu metode klasifikasi yang paling populer karna memiliki kompleksitas yang relatif rendah. Dokumen yang digunakan dalam penelitian ini adalah dokumen identitas buku hasil OCR. penelitian ini bertujuan untuk mengekstrak identitas buku sesuai dengan kelas yang sudah di tentukan. Metode K-NN merupakan metode Machine Learning dimana akan membutuhkan data latih dan uji. Penelitian ini akan menggunakan praproses tokenisasi, filtering, dan case folding lalu kemudian akan dilakukan perhitungan bobot menggunakan TF-ICF. Pengujian yang dilakukan menggunakan pengujian black box dan perhitungan akurasi dengan confusion matrix. Hasil analisis dari metode K-NN menunjukan akurasi yang relatif rendah yaitu 38%. Berdasarkan hasil tersebut dapat disimpulkan bahwa metode K-NN yang di gabungkan dengan TF-ICF untuk mengekstrak informasi dari dokumen buku memiliki akurasi yang buruk.