Penerapan Algoritma C4.5 Untuk Klasifikasi Fungsi Senyawa Aktif Menggunakan Kode Simplified Molecular Input Line System (Smiles)
Main Author: | Rochman, Mochammad Iskandar Ardiyansyah |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2018
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/13787/1/Mochammad%20Iskandar%20Ardiyansyah%20Rochman.pdf http://repository.ub.ac.id/13787/ |
Daftar Isi:
- Senyawa merupakan hal yang kerap kali ditemukan didunia ini, dengan wujud zat yang merupakan kumpulan dari senyawa. Senyawa sendiri terbagi atas senyawa aktif dan tidak aktif. Senyawa tersebut memiliki fungsi yang mungkin dapat dimanfaatkan untuk beberapa aspek bila memiliki suatu fungsi seperti obat ataupun perangsang suatu hormon bekerja. Notasi SMILES (Simplified Molecular Masukan Line System) ditemukan oleh David Weininger pada tahun 1980. Notasi SMILES memanfaatkan karakter yang ada pada ASCII yang sangat mudah untuk diproses oleh komputer. Proses klasifikasi notasi SMILES akan sangat bermanfaat untuk mengetahu kelas fungsi dari senyawa tersebut. Penelitian ini dilakukan untuk mengklasifikasi fungsi dari senyawa memanfaatkan notasi SMILES dengan menerapkan algoritme C4.5 sedangkan objeknya adalah 2 kelas fungsi senyawa, diantaranya adalah kelas kanker dan metabolisme. Fitur yang diuji dari penelitian sebanyak 11 fitur. Tahap implementasi dari C4.5 dengan objek notasi SMILES adalah dengan menghitung entropi dan gain setiap atribut, kemudian atribut dengan gain tertinggi akan dijadikan atribut akan dan juga noda dibawahnya. Skema pengujian yang dilakukan diantaranya adalah dari teknik diskritisasi, pembagian panjang notasi SMILES, banyak data latih yang digunakan dan cross-validasi. Hasil dari pengujian terbaik ketika teknik diskritisasi yang dilakukan menggunakan teknik diskritisasi entropy-based, melakukan pembagian nilai panjang notasi SMILES pada setiap atribut fitur, dan penggunaan data latih sebanyak mungkin yaitu akan menghasilkan nilai akurasi sebesar 79,34%. Sedangakan akurasi dari pengujian cross-validation menunjukan angka akurasi sebesar 70,18%.