Identifikasi Tweet Cyberbullying pada Aplikasi Twitter menggunakan Metode Support Vector Machine (SVM) dan Information Gain (IG) sebagai Seleksi Fitur

Main Author: Purnamasari, Ni Made Gita Dwi
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2018
Subjects:
Online Access: http://repository.ub.ac.id/161608/1/Ni%20Made%20Gita%20Dwi%20Purnamasari.pdf
http://repository.ub.ac.id/161608/
Daftar Isi:
  • Cyberbullying merupakan salah satu tindakan yang melanggar UU ITE dimana kejahatan ini dilakukan di media sosial salah satunya aplikasi Twitter. Tindakan ini sulit terdeteksi jika tidak ada yang me-report tweet tersebut. Identifikasi tweet cyberbullying bertujuan untuk mengklasifikasikan tweet yang mengandung konten bullying pada akun Bapak Fadli Zon selaku Wakil Ketua DPR RI. Klasifikasi dilakukan dengan menggunakan metode Support Vector Machine (SVM) dimana metode ini akan mencari hyperplane pemisah antara kelas negatif dan positif. Penelitian ini merupakan klasifikasi teks dimana semakin banyak datanya semakin banyak fitur yang dihasilkan, oleh karena itu penelitian ini juga menggunakan seleksi fitur Information Gain (IG) untuk menyeleksi fitur yang tidak relevan terhadap klasifikasi. Dimana nilai information gain akan diurutkan secara ascending untuk fitur diseleksi berdasarkan nilai threshold yang telah ditentukan. Nilai information gain akan bernilai tinggi jika term merepresentasikan satu kelas dengan hanya muncul sekali atau lebih pada kelas tersebut. Proses sistem dimulai dari text preprocessing dengan tahapan tokenisasi, filtering, stemming dan pembobotan kata. Kemudian melakukan seleksi fitur information gain dengan menghitung nilai entropy tiap kata. Setelah itu melakukan proses klasifikasi berdasarkan fitur yang telah diseleksi dan hasil keluaran sistem berupa identifikasi apakah tweet termasuk bully atau bukan bully. Hasil akurasi menggunakan metode SVM dengan accuracy 75%, precision 70.27%, recall 86.66% dan f-measure 77.61% pada percobaan nilai iterMax = 20, λ = 0.5,