Clustering Dokumen Berita Berbahasa Indonesia Menggunakan Dbscan
Main Author: | Juniar,Elicia |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2012
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/152933/1/051200085.pdf http://repository.ub.ac.id/152933/ |
Daftar Isi:
- Ilmu pengetahuan dan teknologi berkembang sangat pesat, hal ini ditandai dengan banyaknya volume dokumen elektronik, terutama dokumen berita berbahasa Indonesia. Besarnya volume ini tentunya akan menimbulkan masalah dalam hal pencarian. Salah satu cara untuk mempermudah pencarian yaitu dengan clustering dan salah satu metode clustering yang dikembangkan adalah DBSCAN (Density-Based Spatial Clustering of Application with Noise) . DBSCAN membentuk cluster dengan ukuran dan density yang minimal. Density didefinisikan sebagai minimal banyaknya item dalam suatu jarak tertentu dari item lainnya. Dengan algoritma ini, outlier akan tereliminasi karena tidak memiliki density yang cukup untuk membentuk cluster. Pada penelitian ini, akan dibuat aplikasi menggunakan DBSCAN untuk clustering dokumen berita berbahasa Indonesia . Jumlah cluster yang dihasilkan ditentukan oleh sistem . Pada proses clustering, akan digunakan parameter minimal points (minPts) dan parameter epsilon (eps) . Hasil yang didapatkan dari penelitian adalah nilai F-measure sebesar 0,7099 atau 70,99% pada nilai parameter eps = 0,04 dan minPts = 30.