Implementasi Metode Improved K-Nearest Neighbor pada Analisis Sentimen Twitter Berbahasa Indonesia
Main Author: | Putri, PrimaArfianda |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2013
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/145872/1/051306916.pdf http://repository.ub.ac.id/145872/ |
Daftar Isi:
- Twitter merupakan mikroblog yang sedang digemari dan berubah menjadi penyebar informasi yang sangat cepat saat ini. Informasi yang dihasilkan dan beredar melalui media ini sangat bebas dan beragam seperti berita, pertanyaan, opini, komentar, kritik baik yang bersifat positif maupun negatif. Analisis sentimen merupakan salah satu cabang penelitian pada domain Text Mining atau penggalian data berupa teks, yang diantaranya terdapat proses mengolah dan mengekstrak data tekstual secara otomatis untuk mendapatkan informasi. Manfaat analisis sentimen dalam dunia usaha antara lain untuk melakukan pemantauan terhadap sebuah produk. Analisis sentimen dapat digunakan sebagai alat bantu untuk melihat respon konsumen atau masyarakat terhadap suatu produk tertentu, sehingga dapat segera diambil langkah-langkah strategis berikutnya. Proses pada analisis sentimen diawali dengan preprocessing , dilanjutkan dengan pembobotan kata, kemudian pengkategorian yang terdiri dari penghitungan cosine similarity dan klasifikasi sentimen. Preprocessing terdiri dari beberapa tahap yaitu pembersihan dokumen , tokenizing, stopword removal, dan stemming . Metode pembobotan kata yang digunakan pada skripsi ini adalah Term Frequecny – Inverse Document Frequency (TF-IDF) dan menggunakan Improved K-Nearest Neighbor (KNN) sebagai metode klasifikasinya. Metode Improved KNN memiliki kelebihan berupa kestabilan pada berapapun variasi nilai k. Hasil yang telah diperoleh melalui implementasi dan pengujian sistem adalah jumlah data latih, keseimbangan proporsi kategori data latih, dan nilai k berpengaruh terhadap ketepatan hasil analisis sentimen. Rata-rata precision yang diperoleh sistem sebesar 82%, rata-rata recall sebesar 87%, dan rata-rata F-measure sebesar 84%, sehingga dapat disimpulkan efektivitas sistem sudah berjalan dengan relatif baik.