Klasifikasi Dokumen Berita Twitter Menggunakan Metode Fuzzy K-Nearest Neighbor (Fk-Nn) Dengan Term Weighting Berbasis Indeks Dokumen Dan Kelas
Main Author: | Robiansyah, Candra |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2017
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/147521/1/LAPORAN_SKRIPSI_125150102111001_CANDRA_ROBIANSYAH.pdf http://repository.ub.ac.id/147521/ |
Daftar Isi:
- Informasi atau berita merupakan kebutuhan bagi setiap manusia. Bahkan seperti halnya media sosial terdapat berbagai macam informasi dari berbagai bidang didalamnya, media news survey pada tahun 2013 menunjukkan 86% informasi didapatkan dari twitter. Dimana survey ini didapat dari responden pengguna twitter. Tidak heran bahwa ada banyak Official account pada twitter. Walaupun suatu Official account memiliki topik berita masing-masing, tidak jarang pula mereka memposting topik lain. Untuk itu diperlukan adanya suatu pengklasifikasian yang didasarkan pada short text berita tersebut, bukan pada Official account. Oleh karena itu pada penelitian ini akan dilakukan pengklasifikasian terhadap short text berita twitter dan melakukan pemilihan metode term weighting terbaik diantara pembobotan kata berbasis dokumen (TF.IDF) dan berbasis kelas (TF.IDF.ICF dan TF.IDF.ICS?F). Metode Fuzzy K-Nearest Neighbor (FK-NN) digunakan untuk proses klasifikasi, karena metode ini lebih baik dibanding metode K-Nearest Neighbor (K-NN) dengan akurasi terbaik sebesar 92%. Dari hasil pengujian term weighting menggunakan berbagai variasi data latih dan nilai k, pembobotan TF.IDF menghasilkan akurasi maksimum sebesar 90%. Untuk Pembobotan kata berbasis kelas TF.IDF.ICF, nilai akurasi tertinggi yang dihasilkan sebesar 92% pada 200 data latih, sedangkan pembobotan TF.IDF.ICS?F bisa menghasilkan akurasi tertinggi mencapai 94% pada penggunaan 500 data latih.