Pendekatan Level Data untuk Menangani Ketidakseimbangan Data Menggunakan Algoritma K-Nearest Neighbor
Main Authors: | Perangin-angin, Resianta, Harianja, Eva Julia Gunawati, Jaya, Indra Kelana |
---|---|
Format: | Article info application/pdf eJournal |
Bahasa: | ind |
Terbitan: |
STMIK TIME
, 2020
|
Online Access: |
http://ejournal.stmik-time.ac.id/index.php/jurnalTIMES/article/view/615 http://ejournal.stmik-time.ac.id/index.php/jurnalTIMES/article/view/615/177 |
Daftar Isi:
- Dalam penelitian ini digunakan dataset yang memiliki tingkat ketidakseimbangan yang berbeda beda mulai dari 16.40, 8.60, 2.06, 2.78, 1.87, tentu hal ini dapat menurunkan kinerja algoritma klasifikasi. Secara umum ketidakseimbangan kelas dapat ditangani dengan dua pendekatan, yaitu level data dan level algoritma. Pendekatan level data ditujukan untuk memperbaiki keseimbangan kelas, sedangkan pendekatan level algoritma ditujukan untuk memperbaiki algoritma atau menggabungkan (ensemble) pengklasifikasi agar lebih konduktif terhadap kelas minoritas. Pada penelitian ini diusulkan pendekatan level data dengan resampling, yaitu random oversampling (ROS), dan random undersampling (RUS), Pengklasifikasi yang digunakan adalah k-near neighbors. Hasil penelitian menunjukkan bahwa model ROS+KNN dan RUS+KNN didapat dengan selisih G-Means sebesar 13% dan F-Measure 2,08%, dari, hal ini menunjutkan bahwa RUS+KNN dan ROS+KNN bisa meningkatkan akurasi dari G-Mean dan F-Measure namun tidak memiliki perbedaan yang signifikan.