Klasifikasi Berita Pada Twitter Dengan Menggunakan Metode Naϊve Bayes Dan Feature Expansion Berbasis Cosine Similarity
Main Author: | Febriana, Resti |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2018
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/13642/1/Resti%20Febriana.pdf http://repository.ub.ac.id/13642/ |
Daftar Isi:
- Informasi telah menjadi hal yang sangat dibutuhkan di era modern ini, terlebih dengan adanya berbagai media sosial yang mendukung perbaruan informasi. Twitter sebagai salah satu media sosial yang aktif digunakan untuk memperbarui informasi yang tergolong dalam short text atau berita pendek yang memiliki beberapa kesulitan ketika dilakukan klasifikasi, seperti kata yang ambigu, kata yang terdapat dalam data uji tidak pernah muncul dalam data latih dan sebagainya. Penelitian ini dilakukan untuk mengetahui pengaruh penggunaan feature expansion atau penambahan kata pada short text dalam hasil klasifikasi. Sebelum dilakukan klasifikasi, terlebih dahulu data yang akan diujikan ditambahkan dengan daftar kata yang telah dibuat sebelumnya sebagai sumber eksternal atau kamus dengan batasan tertentu yang telah ditetapkan. Batasan ini bertujuan untuk mengetahui nilai batasan minimal yang paling optimal dalam menghasilkan akurasi tertinggi dalam proses klasifikasi. Dalam proses pembuatan sumber eksternal dilakukan proses cosine similarity untuk mencari kedekatan antar kata. Hasil penelitian berupa akurasi yang menunjukkan adanya pengaruh penambahan feature expansion dalam hasil klasifikasi, hasil akurasi sebesar 83% pada klasifikasi tanpa penggunaan feature expansion dan meningkat menjadi 87% pada penggunaan feature expansion dengan nilai threshold 0,9.