KLASTERISASI DOKUMEN ARTIKEL ILMIAH MENGGUNAKAN ALGORITMA SINGLE PASS CLUSTERING DENGAN DETEKSI KESAMAAN KATA

Main Author: Hasan, Rania
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2015
Subjects:
Online Access: http://eprints.umm.ac.id/22817/1/jiptummpp-gdl-raniahasan-41249-1-pendahul-n.pdf
http://eprints.umm.ac.id/22817/2/jiptummpp-gdl-raniahasan-41249-2-babi.pdf
http://eprints.umm.ac.id/22817/
Daftar Isi:
  • Meningkatnya jumlah dokumen artikel ilmiah menyebabkan pembaca dokumen artikel ilmiah akan kesulitan untuk memperoleh informasi yang diinginkan jika dokumen tidak terkelompok dengan baik. Oleh karena itu klastering dokumen sangat dibutuhkan untuk mengatasi masalah tersebut. Dimana klastering adalah proses mengelompokkan dokumen berdasarkan kemiripan antara satu dokumen dengan dokumen yang lain untuk membentuk suatu klaster. Klasterisasi dari penelitian ini menggunakan algoritma Single Pass Clustering dengan deteksi kesamaan kata pada dokumen artikel ilmiah. Single Pass Clustering merupakan suatu tipe klastering yang berusaha melakukan pengelompokan data satu demi satu dan pembentukan kelompok dilakukan seiring dengan pengevaluasian setiap data yang dimasukkan ke dalam proses klaster. Untuk mengukur tingkat kemiripan antara dokumen satu dengan yang lain menggunakan cosine similarity. Metode pengujian yang digunakan untuk mengukur kualitas cluster adalah purity. Berdasarkan hasil pengujian yang dilakukan, hasil terbaik terletak pada threshold 0.06 yang menghasilkan purity sebesar 0.85918, hal ini dapat disimpulkan bahwa klasterisasi dokumen artikel ilmiah menggunakan algoritma Single Pass Clustering dengan deteksi kesamaan kata memberikan hasil kualitas klaster cukup baik.