Daftar Isi:
  • Text Miningdisebutjuga text data mining (TDM) atauKnowledge Discovery in Textadalahpenemuaninformasibarudantidakdiketahuisebelumnyaolehkomputer, dengansecaraotomatismengekstrakinformasidarisumber-sumbertekstidakterstruktur yang berbeda. PadasistemText Miningdikenalberbagaimetodedalampengelompokansuatuteks, salahsatunyaClustering K-means.K- meansadalahsalahsatumetodepengklasterandenganpendekatanpartisi yang mempartisi data yang adakedalambentuksatuataulebihkelompok.Untukmetodepengujian clusteringdigunakanalgoritma winnowing, algoritmainiberfungsiuntukmembentukdokumenteksmenjadisekumpulannilaifingerprint.Dalammet ode k-means digunakanJaccard CoefficientdanEuclidian Distance untukmengukurtingkatSimilarityantaradokumen. Dari hasilpengujianrelevance jaccard coefficient didapatuntuk 4 kelompoksebanyak 73,5 %, pada 7 kelompok 79 %, danuntuk 5 kelompok 96,66%, sementararelevanceeuclidian distancedidapatuntuk 4 kelompok 49,5%, pada 7 kelompokrelevancegagal, dan 5 kelompok 58,33%. Hasilakhirpengujianinididapatmetodesimilarity yang lebihbaikdenganmenggunakanjaccardcoeeficient. Kata Kunci: Clustering, Euclidian Distance, Jaccard Coefficient, K-means, Relevance, Similarity, Text Mining.