Pengklasteran Novel Menggunakan Algoritma Shrinking Based Shared Nearest Neighbour (SSNN)

Main Author: Hidayat, NasrulAkhmad
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2014
Subjects:
Online Access: http://repository.ub.ac.id/145994/1/SKRIPSI.pdf
http://repository.ub.ac.id/145994/
Daftar Isi:
  • Novel adalah salah satu jenis buku yang sangat diminati masyarakat. Semakin banyaknya jumlah dan genre novel diperlukan pengelompokan novel yang baik untuk mempermudah pengguna dalam mencari dan memperoleh informasi. Pada penelitian ini digunakan Algoritma Shrinking Based Shared Nearest Neighbour (SSNN) dan metode Unsupervised Feature Selection antara Term Contribution (TC) dan Document Frequency (DF) dalam pengelompokan novel. Algoritma SSNN menggunakan konsep pergerakan data Algoritma Data Shrinking untuk memperkuat kepadatan graph ketetanggaan. Sedangkan, metode feature selection digunakan untuk mengurangi dimensionalitas suatu data pada text clustering sehingga dapat meningkatkan performansi clustering. Hasil pengujian memperlihatkan nilai f-measure menggunakan Algoritma SSNN sebesar 0.88. Kesalahan pengklasteran terjadi ketika nilai parameter k (ketetanggaan terdekat), CP (Current Point), dan MP (Move Point) yang dimasukkan terlalu kecil sehingga beberapa titik ketetanggaan tidak masuk dalam proses pembentukan cluster. Sedangkan pada pengujian pengaruh penggunaan metode Unsupervised Feature Selection, yaitu penggunaan metode DF lebih baik jika dibandingkan metode TC dikarenakan metode DF mempertahankan term yang memiliki term frekuensi yang besar dan terjadi dibanyak dokumen sehingga menghasilkan nilai similarity antar dokumen yang cukup baik dibandingkan metode TC dalam proses pembentukan cluster. Dari segi waktu komputasi yang digunakan, metode DF memiliki waktu komputasi yang lebih cepat dibandingkan dengan metode TC dengan selisih waktu 0.5 hingga 5 detik karena proses perhitungan metode DF lebih sederhana daripada metode TC.