PENENTUAN TINGKAT KEMIRIPAN LAPORAN KERJA PRAKTEK MENGGUNAKAN METODE PEMBOBOTAN TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY DAN COSINE SIMILARITY(STUDI KASUS: JURUSAN TEKNIK INFORMATIKA)
Daftar Isi:
- Tindakan plagiarism sering terjadi di dunia pendidikan seperti pada penulisan-penulisan hasil karya ilmiah yang dilakukan oleh pihak mahasiswa maupun dosen. Di Jurusan Teknik Informatika ditemukan beberapa laporan kerja praktek yang terindikasi melakukan plagiarism. Maka, dibuatlah sebuah aplikasi pendeteksi kemiripan laporan kerja praktek, dengan menerapkan metodepembobotan term frequency-inverse document frequency(TF-IDF)yang dipengaruhi oleh jumlah frekuensi kemunculan kata. Kemudian hasil dari perhitungan TF-IDF dihitung jumlah persentasi kemiripannya menggunakan cosine similarity. Pengujian dilakukan menggunakan data laporan kerja praktek semester ganjil 2016/2017 yang telah diseminarkan, pendeteksian kemiripan dilakukan dengan membandingkan persentasi kemiripan dengan pemotongan 1 kata, 2 kata, 3 kata, dan 4 kata. Dokumen akan ditampilkan dan diurutkan berdasarkan dokumen yang paling mirip dilihat dari nilai persentasi kemiripan tertinggi antara dokumen uji dan dokumen sumber. Dari hasil pengujian diperoleh tiga dokumen yang memiliki hasil persentasi kemiripan tertinggi dengan dokumen uji yaitu Dok 1 15,57%, Dok 3 5,17% dan Dok 2 4,6%. Kata Kunci: Cosine Similarity, Kerja Praktek, Pemotongan Kata, Plagiarism, Term Frequency-Inverse Document Frequency