K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA
Main Authors: | Susanti, Susanti, Martha, Shantika, Sulistianingsih, Evy |
---|---|
Format: | Article info application/pdf eJournal |
Bahasa: | eng |
Terbitan: |
FMIPA Universitas Tanjungpura
, 2018
|
Online Access: |
http://jurnal.untan.ac.id/index.php/jbmstr/article/view/23498 http://jurnal.untan.ac.id/index.php/jbmstr/article/view/23498/18474 |
Daftar Isi:
- Missing data adalah suatu informasi yang tidak tersedia dalam suatu data. Missing data mempengaruhi hasil penelitian karena keberadaan missing data dapat mengurangi tingkat akurasi dari hasil penelitian. Missing data dapat diatasi dengan imputasi. Imputasi merupakan suatu metode yang mengatasi missing data dengan mengisi nilai yang hilang dengan suatu nilai berdasarkan informasi lain yang didapat dari data tersebut. Salah satu metode imputasi adalah metode K Nearest Neighbor (KNN). Penelitian ini dilakukan untuk memprediksi nilai yang hilang dengan metode KNN. KNN bekerja dengan menghitung weight mean estimation berdasarkan jumlah K. K adalah jumlah observasi terdekat yang akan digunakan. Dalam penelitian ini, K yang digunakan yaitu , , , dan . Mean Square Error (MSE) dan Mean Absolute Percentage Error (MAPE) digunakan untuk mengetahui ketepatan hasil imputasi. Berdasarkan nilai rata-rata MSE dan MAPE dari replikasi, KNN terbaik pada missing data dan terjadi pada saat , sedangkan untuk missing data 30% terjadi saat .Kata kunci : weight mean estimation, MSE, MAPE