Clustering Dokumen Skripsi Dengan Menggunakan Hierarchical Agglomerative Clustering
Main Author: | Wicaksana, Danang Aditya |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2018
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/162071/1/Danang%20Aditya%20Wicaksana.pdf http://repository.ub.ac.id/162071/ |
Daftar Isi:
- Skripsi adalah suatu dokumen dari karya ilmiah yang disusun oleh mahasiswa pada tingkat strata 1 yang membahas suatu topik atau bidang tertentu dari hasil penelitian atau pengembangan yang telah dilakukan oleh mahasiswa tersebut guna mengikuti ujian akhir untuk memperoleh gelar sarjana. Pada Ruang Baca Fakultas Ilmu Komputer dan Perpusatakaan Pusat Universitas Brawijaya terdapat masalah yang timbul yaitu tidak ada pengkategorian seluruh dokumen skripsi yang disimpan. Metode Hierarchical Agglomerative Clustering (HAC) diimplementasikan untuk clustering dokumen skripsi berdasarkan judul skripsi. HAC mengelompokkan dokumen secara iterative mulai dari cluster terkecil hingga 1 cluster terbesar. Input data yaitu berupa judul dokumen skripsi Teknik Informatika Universitas Brawijaya. Tahap preprocessing dilakukan terhadap data judul skripsi untuk mendapatkan fitur berupa term. Seluruh term yang didapatkan diproses untuk mendapatkan bobot TF-IDF. Nilai kemiripan antar dokumen diperoleh dari nilai cosine distance. Proses clustering menggunakan 3 pilihan jarak sebagai parameter yaitu single linkage, complete linkage dan average linkage. Hasil clustering dari masing-masing parameter jarak ditampilkan label tiap cluster yang dihasilkan dan tiap cluster yang dihasilkan dievaluasi menggunakan silhouette coefficient. Dari hasil pengujian terhadap 100 dokumen skripsi diperoleh nilai Silhouette Coefficient dari single linkage adalah 0,10125, complete linkage adalah 0,155733 dan average linkage adalah 0,160428. Average linkage lebih baik dalam mengelompokkan dokumen dibandingkan single linkage dan complete linkage.