Implementasi Fuzzy K-Nearest Neighbor (FKNN) untuk Mengklasifikasi Fungsi Senyawa Berdasarkan Simplified Molecular Input Line Entry System (SMILES)

Main Author: Tigusti, Raden Rizky Widdie
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2018
Subjects:
Online Access: http://repository.ub.ac.id/162029/1/Raden%20Rizky%20Widdie%20Tigusti.pdf
http://repository.ub.ac.id/162029/
Daftar Isi:
  • Senyawa aktif adalah senyawa kimia yang memiliki banyak fungsi. Salah satu fungsi dari senyawa aktif yaitu sebagai obat. Senyawa aktif memiliki karakteristik khusus yang menentukan fungsi sebagai obat. Untuk mendapatkan nilai karakteristik pada senyawa aktif digunakan notasi SMILES sebagai masukan agar dapat dengan mudah dilakukan proses komputasi pada sistem. Notasi SMILES merupakan notasi kimia modern yang dapat disimpan pada variabel string sehingga memudahkan proses klasifikasi pada sistem. Untuk mendapatkan karakteristik pada senyawa notasi SMILES yang dijadikan sebagai masukan akan dibagi kedalam 12 fitur yang terdiri dari atom B, C, N, O, P, S, F, Cl, Br, I, OH dan panjang dari notasi SMILES. Nilai dari setiap fitur didapatkan dari proses preprocessing terhadap notasi SMILES yang dilakukan pada awal proses klasifikasi. Pada proses klasifikasi fungsi senyawa aktif menggunakan metode fuzzy knearest neighbor yang memiliki kelebihan dalam pemrosesan data dalam jumlah besar. Metode fuzzy k-nearest neighbor merupakan penggabungan dari dua metode yaitu metode fuzzy dan k-nearest neighbor. Langkah penting dari proses klasifikasi dengan menggunakan metode fuzzy k-nearest neighbor yaitu dimulai dengan menghitung jarak dari setiap data uji terhadap data latih dengan menggunakan metode euclidean distance, mengambil nilai sebanyak k dan menghitung fuzzy. Pengujian pada penelitian ini menggunakan dataset sebanyak 631 dan dibagi menjadi 2 yaitu data latih dan data uji dengan masing-masing komposisi data latih dan data uji sebesar 80% (503 data) dan 20% (128 data). Hasil dari pengujian didapatkan nilai akurasi sebesar 71% dengan nilai k sebesar 15, sedangkan pada pengujian k-fold cross validation nilai akurasi terbesar yang didapatkan yaitu sebesar 77%.