Implementasi Algoritma Levenshtein Distance untuk Typo Correction Bahasa Indonesia pada User Feedback Aplikasi
Main Author: | Setiabudi, Reza |
---|---|
Format: | Thesis NonPeerReviewed application/pdf |
Bahasa: | eng |
Terbitan: |
, 2020
|
Subjects: | |
Online Access: |
http://kc.umn.ac.id/13504/1/HALAMAN_AWAL.pdf http://kc.umn.ac.id/13504/2/DAFTAR_PUSTAKA.pdf http://kc.umn.ac.id/13504/3/BAB_I.pdf http://kc.umn.ac.id/13504/4/BAB_II.pdf http://kc.umn.ac.id/13504/5/BAB_III.pdf http://kc.umn.ac.id/13504/6/BAB_IV.pdf http://kc.umn.ac.id/13504/7/BAB_V.pdf http://kc.umn.ac.id/13504/8/LAMPIRAN.pdf http://kc.umn.ac.id/13504/ |
Daftar Isi:
- Penelitian ini mengimplementasikan Algoritma Levenshtein Distance untuk Typo Correction pada User Feedback. Typo Correction dilakukan dalam tahap preprocessing dalam melakukan klasifikasi User Feedback, agar tidak ada kata yang salah penulisan dianggap menjadi kata yang berbeda pada perhitungan klasifikasi. Kata yang error akan dicocokan dengan kata yang ada pada Kamus Besar Bahasa Indonesia (KBBI) dan dicari jarak yang terpendek dan nilai kemiripan tertinggi sebagai penggantinya. Dataset User Feedback dilakukan Tokenizing lalu dimasukan ke fungsi Typo Correction per token-nya, kemudian di return kata yang terdapat dalam KBBI. Kemudian output yang dibentuk menjadi dataframe dibagi datanya untuk train dan test, baru kemudian dilakukan klasifikasi menggunakan algoritma Naive Bayes. Berdasarkan hasil uji coba, dengan pengelompokan kata berdasarkan panjang karakter memiliki akurasi dari 14,2% sampai 90,9%, sedangkan dengan hasil pengujian klasifikasi akurasi meningkat sebesar 8% dari data yang tidak dilakukan typo correcting.