RANCANG BANGUN APLIKASI DOKUMEN CLUSTERING DENGAN METODE K-MEANS BERDASARKAN WINNOWING FINGERPRINT SIMILARITY
Main Author: | Rio Wiliyanto, |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2014
|
Subjects: | |
Online Access: |
http://repository.uin-suska.ac.id/3810/1/Fm.pdf http://repository.uin-suska.ac.id/3810/2/BAB%20I.pdf http://repository.uin-suska.ac.id/3810/3/BAB%20II.pdf http://repository.uin-suska.ac.id/3810/4/BAB%20III.pdf http://repository.uin-suska.ac.id/3810/5/BAB%20IV.pdf http://repository.uin-suska.ac.id/3810/6/BAB%20V.pdf http://repository.uin-suska.ac.id/3810/7/em.pdf http://repository.uin-suska.ac.id/3810/ |
Daftar Isi:
- Text Miningdisebutjuga text data mining (TDM) atauKnowledge Discovery in Textadalahpenemuaninformasibarudantidakdiketahuisebelumnyaolehkomputer, dengansecaraotomatismengekstrakinformasidarisumber-sumbertekstidakterstruktur yang berbeda. PadasistemText Miningdikenalberbagaimetodedalampengelompokansuatuteks, salahsatunyaClustering K-means.K- meansadalahsalahsatumetodepengklasterandenganpendekatanpartisi yang mempartisi data yang adakedalambentuksatuataulebihkelompok.Untukmetodepengujian clusteringdigunakanalgoritma winnowing, algoritmainiberfungsiuntukmembentukdokumenteksmenjadisekumpulannilaifingerprint.Dalammet ode k-means digunakanJaccard CoefficientdanEuclidian Distance untukmengukurtingkatSimilarityantaradokumen. Dari hasilpengujianrelevance jaccard coefficient didapatuntuk 4 kelompoksebanyak 73,5 %, pada 7 kelompok 79 %, danuntuk 5 kelompok 96,66%, sementararelevanceeuclidian distancedidapatuntuk 4 kelompok 49,5%, pada 7 kelompokrelevancegagal, dan 5 kelompok 58,33%. Hasilakhirpengujianinididapatmetodesimilarity yang lebihbaikdenganmenggunakanjaccardcoeeficient. Kata Kunci: Clustering, Euclidian Distance, Jaccard Coefficient, K-means, Relevance, Similarity, Text Mining.