Perbandingan CART dan Random Forest untuk Deteksi Kanker berbasis Klasifikasi Data Microarray
Main Authors: | Riska Chairunisa, Adiwijaya, Widi Astuti |
---|---|
Format: | Article info application/pdf Journal |
Bahasa: | eng |
Terbitan: |
Ikatan Ahli Informatika Indonesia (IAII)
, 2020
|
Subjects: | |
Online Access: |
http://jurnal.iaii.or.id/index.php/RESTI/article/view/2083 http://jurnal.iaii.or.id/index.php/RESTI/article/view/2083/309 |
Daftar Isi:
- Cancer is one of the deadliest diseases in the world with a mortality rate of 57,3% in 2018 in Asia. Therefore, early diagnosis is needed to avoid an increase in mortality caused by cancer. As machine learning develops, cancer gene data can be processed using microarrays for early detection of cancer outbreaks. But the problem that microarray has is the number of attributes that are so numerous that it is necessary to do dimensional reduction. To overcome these problems, this study used dimensions reduction Discrete Wavelet Transform (DWT) with Classification and Regression Tree (CART) and Random Forest (RF) as classification method. The purpose of using these two classification methods is to find out which classification method produces the best performance when combined with the DWT dimension reduction. This research use five microarray data, namely Colon Tumors, Breast Cancer, Lung Cancer, Prostate Tumors and Ovarian Cancer from Kent-Ridge Biomedical Dataset. The best accuracy obtained in this study for breast cancer data were 76,92% with CART-DWT, Colon Tumors 90,1% with RF-DWT, lung cancer 100% with RF-DWT, prostate tumors 95,49% with RF-DWT, and ovarian cancer 100% with RF-DWT. From these results it can be concluded that RF-DWT is better than CART-DWT.
- Kanker merupakan salah satu penyakit yang mematikan di dunia dengan tingkat kematian 57,3% pada tahun 2018 di benua Asia. Maka dari itu, diperlukannya diagnosis dini untuk menghindari peningkatan angka kematian yang disebabkan oleh penyakit kanker. Seiring berkembangnya pembelajaran mesin, data gen kanker dapat diolah menggunakan microarray untuk deteksi terjangkitnya penyakit kanker sejak dini. Namun permasalahan yang dimiliki microarray adalah jumlah atribut yang sangat banyak sehingga perlu dilakukan reduksi dimensi. Untuk mengatasi permasalahan tersebut, dalam makalah ini digunakan reduksi dimensi Discrete Wavelet Transform (DWT). Selanjutnya digunakan Classification and Regression Tree (CART) dan Random Forest (RF) sebagai metode klasifikasinya. Tujuan penggunaan kedua metode klasifikasi tersebut untuk mengetahui metode klasifikasi mana yang menghasilkan performa paling baik. Pada penelitian ini digunakan lima data microarray yaitu Colon Tumor, Breast Cancer, Lung Cancer, Prostate Tumor dan Ovarian Cancer dari Kent-Ridge Biomedical Dataset. Akurasi terbaik yang didapat pada penelitian ini untuk data breast cancer sebesar 76,92% dengan CART-DWT, Colon Tumor sebesar 90,1% dengan RF-DWT, lung cancer sebesar 100% dengan RF-DWT, prostate tumor sebesar 95,49% dengan RF-DWT, dan ovarian cancer sebesar 100% dengan RF-DWT. Dari hasil tersebut maka dapat disimpulkan bahwa RF-DWT lebih baik dibandingkan CART-DWT