Penerapan Naive Bayes untuk Mengurangi Data Noise pada Klasifikasi Multi Kelas dengan Decision Tree

Main Author: Khadafy, Al Riza; Intelligent Systems
Format: Article info application/pdf eJournal
Bahasa: eng
Terbitan: IlmuKomputer.Com
Online Access: http://journal.ilmukomputer.org/index.php/jis/article/view/78
http://journal.ilmukomputer.org/index.php/jis/article/view/78/50
http://journal.ilmukomputer.org/index.php/jis/article/downloadSuppFile/78/26
local_ids_str_mv IOS3321.article-78
IOS366.article-78
ctrlnum article-78
language eng
format Journal:Article
Journal
Other:info:eu-repo/semantics/publishedVersion
Other
File:application/pdf
File
Journal:eJournal
author Khadafy, Al Riza; Intelligent Systems
title Penerapan Naive Bayes untuk Mengurangi Data Noise pada Klasifikasi Multi Kelas dengan Decision Tree
publisher IlmuKomputer.Com
url http://journal.ilmukomputer.org/index.php/jis/article/view/78
http://journal.ilmukomputer.org/index.php/jis/article/view/78/50
http://journal.ilmukomputer.org/index.php/jis/article/downloadSuppFile/78/26
contents Selama beberapa dekade terakhir, cukup banyak algoritma data mining yang telah diusulkan oleh peneliti kecerdasan komputasi untuk memecahkan masalah klasifikasi di dunia nyata. Di antara metode-metode data mining lainnya, Decision Tree (DT) memiliki berbagai keunggulan diantaranya sederhana untuk dipahami, mudah untuk diterapkan, membutuhkan sedikit pengetahuan, mampu menangani data numerik dan kategorikal, tangguh, dan dapat menangani dataset yang besar. Banyak dataset berukuran besar dan memiliki banyak kelas atau multi kelas yang ada di dunia memiliki noise atau mengandung error. Algoritma pengklasifikasi DT memiliki keunggulan dalam menyelesaikan masalah klasifikasi, namun data noise yang terdapat pada dataset berukuran besar dan memiliki banyak kelas atau multi kelas dapat mengurangi akurasi pada klasifikasinya. Masalah data noise pada dataset tersebut akan diselesaikan dengan menerapkan pengklasifikasi Naive Bayes (NB) untuk menemukan instance yang mengandung noise dan menghapusnya sebelum diproses oleh pengklasifikasi DT. Pengujian metode yang diusulkan dilakukan dengan delapan dataset uji dari UCI (University of California, Irvine) machine learning repository dan dibandingkan dengan algoritma pengklasifikasi DT. Hasil akurasi yang didapat menunjukkan bahwa algoritma yang diusulkan DT+NB lebih unggul dari algoritma DT, dengan nilai akurasi untuk masing-masing dataset uji seperti Breast Cancer 96.59% (meningkat 21,06%), Diabetes 92,32% (meningkat 18,49%), Glass 87,50% (meningkat 20,68%), Iris 97,22% (meningkat 1,22%), Soybean 95,28% (meningkat 3,77%), Vote 98,98% (meningkat 2,66%), Image Segmentation 99,10% (meningkat 3,36%), dan Tic-tac-toe 93,85% (meningkat 9,30%). Dengan demikian dapat disimpulkan bahwa penerapan NB terbukti dapat menangani data noise pada dataset berukuran besar dan memiliki banyak kelas atau multi kelas sehingga akurasi pada algoritma klasifikasi DT meningkat
institution IlmuKomputer.com
collection Journal of Software Engineering
Journal of Intelligent Systems
first_indexed 2016-09-21T13:20:51Z
id 57e42e43ee900dbfd18b456b
recordtype merged
merged_boolean 1
_version_ 1546200646945865728
score 17.538404