Implementasi Gabungan Metode K-means Learning Vector Quantization (LVQ) Untuk Klasifikasi Fungsi Senyawa Aktif Menggunakan Data SMILES

Main Author: Ilmiyah, Nur Khilmiyatul
Format: Thesis NonPeerReviewed
Terbitan: , 2018
Subjects:
Online Access: http://repository.ub.ac.id/167010/
Daftar Isi:
  • Senyawa aktif memiliki karakteristik khusus yang menentukan fungsi sebuah obat. Obat berfungsi untuk tindakan pencegahan atau penyembuhan terhadap suatu penyakit yang diderita oleh pasien. Untuk mengetahui kegunaan suatu senyawa dibutuhkan notasi SMILES. Notasi SMILES adalah bentuk representasi suatu senyawa aktif dengan notasi kimia terbaru sehingga komputer bisa membaca unsur senyawa tersebut. Keunggulan notasi SMILES selain adanya karakter American Standart Code for Information Interchange (ASCII) yang tersimpan dalam variabel string yaitu mudah diproses dan tidak membutuhkan kapasitas memori yang besar. Pengelompokan notasi SMILES dilakukan dengan mengambil 12 fitur yang terdiri dari atom B, C, N, O, P, S, F, Cl, Br, I, OH dan panjang notasi SMILES. Nilai setiap fitur akan diproses melalui preprocessing menggunakan Regex yang dilakukan awal proses. Pada proses klasifikasi fungsi senyawa aktif menggunakan dua gabungan metode yaitu K-means Learning Vector Quantization (LVQ). Langkah penting dari proses klasifikasi menggunakan metode gabungan metode K-means Learning Vector Quantization (LVQ) yaitu dimulai dengan proses K-means dengan menghitung jarak dari setiap data uji terhadap data latih atau yang biasa disebut dengan Euclidean distance, mengambil nilai sebanyak k dan mengecek jumlah data apakah lebih dari nilai ambang batas apablia iya maka dilakukan proses K-means dan jika tidak maka dilakukan proses LVQ. Pengujian penelitian ini menggunakan dataset sebanyak 664 dan dibagi menjadi 2 yaitu data latih dan data uji dengan masing-masing komposisi banyak data latih dan data uji sebesar 80% dan 20% sehingga untuk data latih sebanyak 531 dan data uji sebanyak 133. Berdasarkan hasil pengujian K-means LVQ menghasilkan nilai akurasi sebesar 72.22% sedangkan K-means konvensional 52.65%. Pengujian menggunakan K-means LVQ mengasilkan akurasi lebih baik dibandingkan K-means Konvensional.