Hoax Detection at Social Media With Text Mining Clarification SystemBased
Main Authors: | Tammam, Aditya Gusti, Sucipto, Sucipto, Indriati, Rini |
---|---|
Format: | Article PeerReviewed Book |
Bahasa: | eng |
Terbitan: |
STKIP PGRI Tulungagung
, 2018
|
Subjects: | |
Online Access: |
http://repository.unpkediri.ac.id/2710/2/57201_0721029101.pdf http://repository.unpkediri.ac.id/2710/1/57201_0721029101_Similarity.pdf http://repository.unpkediri.ac.id/2710/3/57201_0721029101_PeerReview.pdf http://repository.unpkediri.ac.id/2710/ https://jurnal.stkippgritulungagung.ac.id/index.php/jipi/article/view/837 http://dx.doi.org/10.29100/jipi.v3i2.837 |
Daftar Isi:
- Hoax adalah isu terkini yang meresahkan masyarakat dan menyebabkan kerusuhan di berbagai bidang, mulai dari politik, budaya, keamanan dan ketertiban, hingga ekonomi. Masalah ini tidak dapat dipisahkan dari dampak penggunaan media sosial yang cepat. Akibatnya, setiap hari ada ribuan informasi yang tersebar di media sosial, yang belum tentu valid, sehingga orang-orang berpotensi terkena tipuan di media sosial. Sistem pendeteksian tipuan dalam penelitian ini dirancang dengan pendekatan Pembelajaran Tanpa Pengawasan sehingga tidak memerlukan pelatihan data. Sistem ini dibangun menggunakan algoritma Peringkat Teks untuk ekstraksi kata kunci dan algoritma Cosine Similarity untuk menghitung tingkat kemiripan dokumen. Hasil ekstraksi kata kunci akan digunakan untuk mencari konten yang terkait dengan masukan dari pengguna menggunakan mesin pencari, lalu menghitung nilai kemiripan. Jika konten yang terkait cenderung berasal dari media tepercaya, maka konten tersebut berpotensi faktual. Demikian juga, jika konten yang terkait cenderung dipublikasikan oleh media yang tidak dapat diandalkan, maka ada potensi untuk tipuan. Sistem pendeteksian tipuan telah diuji menggunakan matriks kebingungan, dari 20 data konten berita yang terdiri dari 10 masalah yang benar dan 10 masalah yang salah. Kemudian sistem menghasilkan klasifikasi dengan rincian 13 masalah termasuk salah dan 7 masalah termasuk benar, maka jumlah klasifikasi yang sesuai dengan label asli adalah 15 masalah. Berdasarkan hasil klasifikasi, nilai akurasi 75% diperoleh.