Implementasi Rocchio’s Classification Dalam Megkategorikan Komentar Spam Di Blog
Daftar Isi:
- Spamming mengacu pada suatu informasi yang tidak diinginkan dan tidak relevan bagi pengguna. Fenomena ini sudah tersebar luas dan sering terlihat pada email, pesan singkat, blog dan forum. Pada penelitian ini kami mempertimbangkan masalah spam di blog. Di blog, sistem komentar yang disediakan penulis untuk memfasilitasi interaksi dengan pembaca menjadi target spammer. Sebenarnya pemilik blog sudah mencoba menanggulangi masalah ini dengan melakukan monitoring dan mengelola komentar secara manual dan menggunakan CAPTCHA. Namun hal tersebut belum mampu untuk meminimalkan terjadinya spamming. Solusi lain yang dapat digunakan adalah dengan memanfaatkan metode klasifikasi untuk meminimalkan terjadinya serangan komentar spam. Salah satu metode untuk mengklasifikasi adalah Rocchio Classification. Adapun fitur yang digunakan dalam penelitian ini adalah penggunaan anchor text, selisih waktu antara posting blog dengan komentar, mereferensikan nama pengguna dalam komentar, penghitungan ratio kata dalam komentar dan mengukur tingkat kemiripan antara posting blog dengan komentar. Hasil yang diperoleh dari pengujian dengan menggunakan 400 buah data menunjukkan bahwa metode Rocchio’s Classification mampu digunakan untuk mengklasifikasi komentar spam atau komentar organik dengan rata-rata akurasi 95% dari berbagai skenario pengujian.