Penerapan Metode Fuzzy K-Nearest Neighbor (FK-NN) Untuk Pengklasifikasian Spam Email
Main Author: | Wisdarianto, Ardhy |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2013
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/145814/1/Ardhy_Wisdarianto_-_0810960033.pdf http://repository.ub.ac.id/145814/1/Ardhy_-_0810960033_%28Jurnal%29.pdf http://repository.ub.ac.id/145814/ |
Daftar Isi:
- Spam email atau yang biasa disebut junk email merupakan penyalahgunaan dalam pengiriman berita elektronik untuk menampilkan berita iklan dan keperluan lainnya yang mengakibatkan ketidaknyamanan bagi pengguna layanan email. Semakin banyaknya persebaran spam email di internet saat ini, diperlukan suatu teknik untuk dapat melakukan filtering data email yang dapat membedakan antara email spam dan email non spam atau yang biasa disebut dengan ham mail. Pada penelitian ini digunakan metode Fuzzy K-NN yang merupakan gabungan dari logika Fuzzy dan metode klasifikasi data mining K-NN. Pada metode Fuzzy K-NN untuk klasifikasi email spam ini, email uji yang diklasifikan akan diberikan nilai keanggotaan untuk kelas spam dan kelas ham berdasarkan sejumlah k dokumen yang memiliki jarak terdekat. Proses klasifikasi akan dilakukan dengan memilih nilai keanggotaan kelas tertinggi pada email dokumen uji tersebut. Pada penelitian ini dilakukan pengujian untuk melihat hasil akurasi dari klasifikasi email dengan kategori spam yang dilakukan terhadap penggunaan metode pencarian jarak cosine similarity dan euclidean distance. Pengujian dilakukan dengan penggunaan sejumlah data latih dan nilai k (jumlah tetangga terdekat) yang bervariasi. Pada pengujian didapatkan hasil bahwa penggunaan metode cosine similarity akan menghasilkan akurasi yang lebih baik daripada metode euclidean distance dalam mengklasifikasikan email dengan kategori spam. Dari hasil pengujian dengan metode cosine similarity didapatkan nilai f-measure tertinggi sebesar 0.897959 pada penggunaan jumlah data latih 175 data dengan nilai k=10 dan k=15.