KLASTERISASI DOKUMEN MENGGUNAKAN ALGORITMA K-MEANS DAN SINGULAR VALUE DECOMPOSITION

Main Author: Ayuni, Sielvy
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2016
Subjects:
Online Access: http://eprints.umm.ac.id/34103/1/jiptummpp-gdl-sielvyayun-42904-1-penahulu-n.pdf
http://eprints.umm.ac.id/34103/2/jiptummpp-gdl-sielvyayun-42904-2-babi.pdf
http://eprints.umm.ac.id/34103/
Daftar Isi:
  • Klasterisasi adalah proses mengelompokkan suatu data kedalam sejumlah kelompok klaster menurut karakteristiknya masing-masing. Dimana data yang meimiliki karakteristik sama akan dikelompokkan dalam satu klaster yang sama sedangkan data dengan karakteristik berbeda akan dikelompokkan dengan klaster lainnya. K-Means adalah salah satu metode klasterisasi yang mempartisi data kedalam sejumlah K yang sudah ditentukan diawal. Pada penelitian ini dibentuk dilakukan tahap preprocessing, pembobobtan TFIDF, kemudian hasil pembobotan tersebut dibentuk term-document matriks A. Selanjutnya term- document matriks A dipecah menjadi 3 dimensi matriks yang lebih kecil menggunakan Singular value Decomposition. Dekomposisi nilai matriks A dinyatakan dengan A= USVT. Hasil perkalian matriks U, S, VT yang kemudian dilakukan proses klaster. Data set yang digunakan sebanyak 250 dokumen Tugas Akhir Teknik Informatika UMM. Penerapan SVD pada metode K-Means membantu mempercepat waktu klasterisasi.