PENGUKURAN KEMIRIPAN DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA RABIN-KARP DAN LEVENSHTEIN DISTANCE
Daftar Isi:
- Pengukuran kemiripan menjadi sangat penting untuk menghindari perilaku plagiat. Terdapat beberapa metode yang digunakan untuk mendeteksi plagiarisme. Beberapa diantaranya adalah algoritma Rabin-Karp dan Levenshtein Distance. Pada penelitian ini, penulis mencoba menggabungkan algoritma Rabin-Karp dan Levenshthein Distance untuk pengukuran kemiripan dokumen berbahasa Indonesia. Algoritma Rabin-Karp merupakan algoritma pencarian pola pada teks menggunakan teknik hashing. Pencocokan string akan dilakukan dengan membandingkan nilai hash antara kedua dokumen menggunakan Levenshtein Distance. Pengujian dilakukan dengan membandingkan dokumen uji dan dokumen asli. Kombinasi nilai n-gram, base dan modulo juga diterapkan pada pengujian ini. Hasil pengujian menunjukan, penggabungan kedua metode menghasilkan persentase kemiripan yang cukup baik. Penerapan berbagai kombinasi nilai n-gram base dan modulo menghasilkan persentase kemiripan yang berbeda-beda.