Analisis dan Implementasi Active Fuzzy Constrained Clustering untuk Pengelompokan Dokumen
Main Author: | Syaros Parendo |
---|---|
Format: | Bachelors |
Terbitan: |
Universitas Telkom
, 2010
|
Subjects: | |
Online Access: |
https://openlibrary.telkomuniversity.ac.id/pustaka/94733/analisis-dan-implementasi-active-fuzzy-constrained-clustering-untuk-pengelompokan-dokumen.html |
Daftar Isi:
- ABSTRAKSI: Teknik pengelompokan dokumen teks secara otomatis menjadi suatu bidang penelitian yang penting di mana volume jumlah dokumen teks melalui media digital semakin berkembang pesat. Teknik ini dikenal dengan istilah document clustering. Teknik clustering pada umumnya menggunakan kata dan dokumen biasanya dianggap sebagai kumpulan kata-kata tanpa adanya urutan atau yang disebut bag of word.<br>Ada beberapa metode yang digunakan dalam document clustering. Pada Tugas Akhir ini digunakan algoritma Active Fuzzy Constrained Clustering (AFCC). AFCC merupakan algoritma clustering yang mengkombinasikan metode fuzzy clustering dengan semi-supervised clustering. Pada umumnya, dokumen teks bersifat semi-structured. Sehingga dokumen perlu direpresentasikan menjadi sebuah bentuk yang lebih terstruktur agar dapat dikelompokan dengan baik. Pada Tugas Akhir ini, dokumen akan direpresentasikan sebagai bag-of-words serta dimodelkan sebagai vektor dalam Vector Space Model.<br>Perangkat lunak yang dibuat pada Tugas Akhir ini diujikan untuk beberapa masukan dokumen dan parameter yang berbeda untuk mengetahui pengaruh parameter-parameter tersebut terhadap akurasi hasil clustering. Parameter tersebut antara lain jumlah cluster maksimal, jumlah constraint maksimal per iterasi dan jumlah iterasi maksimal. Pada Tugas Akhir ini, dapat disimpulkan bahwa algoritma AFCC dapat diterapkan untuk pengelompokan dokumen teks. Akurasi hasil clustering dipengaruhi oleh parameter yang digunakan pada saat proses clustering dilakukan. Pendekatan semi-supervised clustering juga dapat membantu meningkatkan akurasi hasil clustering.<br>Kata Kunci : Document clustering, Active Fuzzy Constrained Clustering (AFCC),ABSTRACT: Text document clustering techniques automatically become an important research in which volume of text document via digital media is growing rapidly. This technique is known as document clustering. Clustering technique generally use words and documents are usually regarded as a collection of words without any sequence or so called bag-of-words.<br>There are several methods used in document clustering. In this final project algorithm used Active Fuzzy Constrained Clustering (AFCC). AFCC is a clustering algorithm which combine fuzzy clustering method with semisupervised clustering. In general, text document are semi-structured. So that document needs to be represented into a more structured form in order to be clustered properly. In this final project, document will be represented as bag-of words and modeled as vector in Vector Space Model.<br>Software made in this Final Project tested for several input documents and the different parameters to determine the influence of these parameters to the accuracy of clustering result. These parameters include maximum number of cluster, maximum number of constraints per iteration, and maximum number iteration. The results can be included that AFCC algorithm can be applied for clustering of text document. In addition, accuracy of clustering are influenced by the parameters which used clustering process. Approach of semi-supervised clustering can also improve the accuracy of clustering result.<br>Keyword: Document clustering, Active Fuzzy Constrained Clustering (AFCC),