Optimasi Pemilihan Seeds Dengan Algoritma Pillar Pada Pengelompokan Dokumen Newsgroup Berbahasa Inggris Menggunakan Algoritma K-Means

Main Author: Adinugroho,Sigit
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2012
Subjects:
Online Access: http://repository.ub.ac.id/152964/1/051201646.pdf
http://repository.ub.ac.id/152964/
Daftar Isi:
  • Salah satu bentuk diskusi yang berkembang di dunia maya adalah newsgroup . Besarnya volume newsgroup yang selalu berkembang menyebabkan sulitnya pencarian topik yang diinginkan. Cara alternatif untuk mempermudah pencarian adalah dengan mengelompokkan newsgroup berdasarkan kemiripan isinya. Salah satu metode yang banyak digunakan untuk mengelompokkan data adalah algoritma K-Means . Pada penelitian ini, kelemahan algoritma K-Means dalam menentukan seeds diperbaiki dengan menggunakan algoritma Pillar . Dimensi data yang besar direduksi menggunakan metode Latent Semantic Indexing memanfaatkan Singular Value Decomposition . Penelitian ini menggunakan data berupa 1500 dokumen newsgroup yang terbagi dalam 15 kategori. Selanjutnya dilakukan proses preprocessing terhadap dokumen dan reduksi dimensi bobot menggunakan Singular Value Decomposition . Berdasarkan bobot tereduksi, dilakukan pemilihan seeds menggunakan algoritma Pillar . Hasil penelitian menunjukkan bahwa optimasi pemilihan seeds menggunakan algoritma Pillar mampu menurunkan error ratio rata-rata sebesar 37,64% dibandingkan algoritma K-Means dengan pemilihan seeds acak, dari 38,05% menjadi 24,46%. Waktu yang diperlukan untuk mencapai keadaan konvergen meningkat sebesar rata-rata 69,11%. Penurunan nilai error ratio pada setiap dataset berbeda-beda sesuai dengan karakteristik dataset.