PERBANDINGAN ALGORITMA K-MEANS DAN K-MEDOIDS CLUSTERING PADA PENGELOMPOKAN DATA TEKS

Main Author: T, Lula Lathifah
Format: bachelorthesis doc-type Bachelors
Bahasa: ind
Terbitan: , 2016
Online Access: http://repository.unpad.ac.id/frontdoor/index/index/docId/13675
Daftar Isi:
  • Pada masa modern ini, perkembangan teknologi informasi menjadi suatu kebutuhan bagi masyarakat, salah satunya yaitu media sosial Twitter. Twitter merupakan layanan microblogging yang menyimpan text database yang disebut tweet. Untuk memudahkan memperoleh informasi yang dominan dibicarakan, maka dicarilah topik dari tweet Twitter dengan menggunakan clustering. Pada penelitian ini, akan dibandingkan pengelompokkan menggunakan K-means dan K-medoids clustering untuk mendapatkan clustering paling tepat yang diaplikasikan untuk mengelompokkan tweet agar didapatkan tema atau topik yang dominan dibicarakan pada media sosial Twitter dengan kata kunci Indonesia. Hasil dari penelitian ini menunjukkan bahwa berdasarkan Dunn index yang maksimum, pengelompokan terbaik untuk memperoleh topik yang dominan dibicarakan pada tweet Twitter yaitu Algoritma K-means Clustering sebanyak tiga klaster, yaitu mengenai wisata alam Indonesia, bencana alam Indonesia, dan negara-negara Asia. Kata Kunci: Text Mining, K-means, K-medoids, Dunn Index, dan Twitter ABSTRACT In the modern era, the information technology becomes a necessity for people, one of them is social media Twitter. Twitter is a microblogging service that stores text database called tweets. To obtain information easier that dominant discussed, then sought the topic of tweets Twitter by using clustering. In this study, will be compared using the K-means clustering and K-medoids clustering to get the most appropriate clustering is applied to classification tweets to have the dominant theme or topic discussed on social media Twitter with Indonesia as the keyword. Results from this study, based on the maximum Dunn index is indicate that the best clustering to obtain the dominant topics discussed on tweet Twitter is K-means clustering algorithm and have three clusters, namely is the nature of Indonesia, Indonesia`s natural disasters, and Asian countries. Keyword: Text Mining, K-means, K-medoids, Dunn Index, dan Twitter