Optical Character Recognition Pada Dokumen Karya Tulis Ilmiah Menggunakan Smooth Support Vector Machine

Main Author: Salamah, Russy Marlianti
Format: Thesis NonPeerReviewed Book eArticle
Bahasa: eng
Terbitan: , 2020
Subjects:
Online Access: http://elibrary.unikom.ac.id/id/eprint/2876/1/1.10115080_RUSSY%20MARLIANTI%20SALAMAH_COVER.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/2/19.10115080_RUSSY%20MARLIANTI%20SALAMAH_LEMBAR%20PENGESAHAN.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/3/17.10115080_RUSSY%20MARLIANTI%20SALAMAH_SURAT%20KETERANGAN%20PUBLIKASI.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/4/20.10115080_RUSSY%20MARLIANTI%20SALAMAH_SURAT%20KETERANGAN%20ORISINALITAS.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/5/4.10115080_RUSSY%20MARLIANTI%20SALAMAH_KATA%20PENGANTAR.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/6/5.10115080_RUSSY%20MARLIANTI%20SALAMAH_DAFTAR%20ISI.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/7/11.10115080_RUSSY%20MARLIANTI%20SALAMAH_BAB%201.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/8/12.10115080_RUSSY%20MARLIANTI%20SALAMAH_BAB%202.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/9/13.10115080_RUSSY%20MARLIANTI%20SALAMAH_BAB%203.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/10/14.10115080_RUSSY%20MARLIANTI%20SALAMAH_BAB%204.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/11/15.10115080_RUSSY%20MARLIANTI%20SALAMAH_BAB%205.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/12/10.10115080_RUSSY%20MARLIANTI%20SALAMAH_DAFTAR%20PUSTAKA.pdf
http://elibrary.unikom.ac.id/id/eprint/2876/
http://elibrary.unikom.ac.id
Daftar Isi:
  • OCR (Optical Character Recognition) adalah aplikasi yang berfungsi untuk mengubah gambar hasil scan menjadi teks. Dengan adanya OCR, gambar yang bertulisan tangan, tulisan mesin ketik atau teks komputer, dapat dimanipulasi. Teks yang di-scan dengan OCR dapat dicari kata per kata atau per kalimat. Dan setiap teks dapat dimanipulasi, diganti, atau diberikan barcode. OCR diperlukan untuk dokumen karya tulis ilmiah yang tidak memiliki salinan softcopy, SSVM merupakan pengembangan smoothing technique yang menggantikan plus function SVM dengan integral dari fungsi signoid neural network. Metode SSVM sudah digunakan pada berbagai macam penelitian seperti klasifikasi indeks pembangunan manusia dan klasifikasi pasien diabetes yang masing – masing memiliki akurasi sebesar 84,77% dan 97,11%. SSVM memiliki performa yang lebih baik dalam mengatasi data berdimensi tinggi dan data jumlah besar juga memiliki running yang lebih cepat dan akurasi yang lebih besar. Fokus utama dalam penelitian ini adalah mengukur tingkat akurasi yang dihasilkan oleh SSVM dan metode ekstraksi ciri citra dalam mengenali karakter yang terdapat pada citra hasil scan dokumen karya tulis ilmiah. Sebelum tahap pelatihan dan pengujian SSVM dilakukan, citra melalui tahap preprocessing terlebih dahulu, seperti grayscaling, thresholding, segmentasi baris, segmentasi kata dan segmentasi karakter, resize, binerisasi, serta ekstrasi ciri zoning. Adapun parameter uji yang digunakan dalam penelitian ini, yaitu dengan menggunakan 3 nilai c berbeda, yaitu c=1, c=10, dan c=100. Dari pengujian yang dilakukan terhadap 30 dokumen citra hasil scan abstrak, didapatkan hasil akurasi tertinggi mencapai 4,65 %.