KLASIFIKASI AKUN ALAY DI TWITTER MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER
Daftar Isi:
- Banyaknya pengguna Twitter yang digunakan oleh para remaja menjadikan anak remaja sebagai target pasar penjualan yang tepat bagi suatu perusahaan. Tetapi, sulit untuk mendapatkan datanya, karena tidak semua pengguna Twitter menampilkan tanggal lahir pada akunnya sehingga sulit untuk dapat membedakan pengguna Twitter tersebut remaja atau bukan. Dan hal tersebut dapat diketahui dari gaya bahasa yang digunakan yaitu bahasa Alay.Karena menurut (Kelana, 2011), remaja itu Alay tetapi Alay belum tentu remaja. Dengan begitu, maka dibuatlah aplikasi untuk mengklasifikasi akun Twitter Alay atau tidak dengan menggunakan metode Naïve Bayes Classifier(NBC). Parameter yang digunakan sebanyak 18, yaitu:follower, following, retweet, name, username, description, liked, like, plain status, mention, URL, hashtag, life time, tweet spread, user collective activeness, collective influence, foto/video danemoticon. Datanya di download melalui Twitter API sebanyak50 akun. Kemudian50 akun Twitter dilabeloleh 3 orang yang pernah Alay. Klasifikasi ini menggunakan dua tahapan preprocessing yaitu cleaning dan tokenizing. Output yang dihasilkan berupa Alay dan tidak Alay. Pengujian akurasi sistem dilakukan dengan model Confusion Matrix. Hasil pengujian diketahui bahwa metode NBC dapat diterapkan pada sistem Klasifikasi akun Alay di Twitter dengan tingkat akurasi yang didapat yaitu 86,67%.Kata kunci: alay, confusion matrix, naïve bayes classifier, textpreprocessing