KLASTERISASI DOKUMEN MENGGUNAKAN ALGORITMA K-MEANS DAN SINGULAR VALUE DECOMPOSITION
Main Author: | Ayuni, Sielvy |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2016
|
Subjects: | |
Online Access: |
http://eprints.umm.ac.id/34103/1/jiptummpp-gdl-sielvyayun-42904-1-penahulu-n.pdf http://eprints.umm.ac.id/34103/2/jiptummpp-gdl-sielvyayun-42904-2-babi.pdf http://eprints.umm.ac.id/34103/ |
Daftar Isi:
- Klasterisasi adalah proses mengelompokkan suatu data kedalam sejumlah kelompok klaster menurut karakteristiknya masing-masing. Dimana data yang meimiliki karakteristik sama akan dikelompokkan dalam satu klaster yang sama sedangkan data dengan karakteristik berbeda akan dikelompokkan dengan klaster lainnya. K-Means adalah salah satu metode klasterisasi yang mempartisi data kedalam sejumlah K yang sudah ditentukan diawal. Pada penelitian ini dibentuk dilakukan tahap preprocessing, pembobobtan TFIDF, kemudian hasil pembobotan tersebut dibentuk term-document matriks A. Selanjutnya term- document matriks A dipecah menjadi 3 dimensi matriks yang lebih kecil menggunakan Singular value Decomposition. Dekomposisi nilai matriks A dinyatakan dengan A= USVT. Hasil perkalian matriks U, S, VT yang kemudian dilakukan proses klaster. Data set yang digunakan sebanyak 250 dokumen Tugas Akhir Teknik Informatika UMM. Penerapan SVD pada metode K-Means membantu mempercepat waktu klasterisasi.