Agglomerative Hierarchical Clustering untuk Penggabungan Dokumen Teks Berbahasa Indonesia dengan Metode Complete Linkage
Main Author: | BernadetteShantiC |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2009
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/152229/1/050902736.pdf http://repository.ub.ac.id/152229/ |
Daftar Isi:
- Sistem penggabungan dokumen merupakan sistem yang memberi kemudahan kepada pengguna untuk mendapatkan informasi dari beberapa dokumen sekaligus. Dengan sistem ini, pengguna tidak perlu lagi membaca masing-masing dokumen satu persatu untuk mendapatkan informasi yang dibutuhkan. Dengan demikian, informasi yang didapat akan lebih mudah dicerna dan dimengerti. Permasalahan yang timbul pada saat menggabungkan dokumen adalah bagaimana menggabungkan kalimat-kalimat dari dokumen yang berbeda supaya tetap memiliki keterkaitan satu sama lain. Penggabungan kalimat dilakukan dengan cara mengelompokkan kalimat-kalimat menjadi suatu cluster dengan algoritma hierarchical clustering melalui pendekatan agglomerative , dimana anggota cluster awal adalah masing-masing kalimat yang ada, dan kemudian bergabung menjadi cluster yang lebih besar dengan kalimat yang lain. Aturan penggabungan kalimat ditentukan berdasarkan bobot yang dimiliki masing-masing kalimat. Untuk mengevaluasi sistem penggabungan dokumen ini dilakukan pembandingan dengan dokumen ideal. Ukuran yang digunakan adalah rasio dari jumlah kalimat yang bersesuaian dengan kalimat ideal yang dibandingkan dengan jumlah total kalimat yang ada. Efektifitas sistem meningkat sejalan dengan bertambahnya jumlah dokumen yang digabungkan.