Perbaikan Missing value Menggunakan Pendekatan Korelasi Pada Metode K-Nearest Neighbor
Main Authors: | Irawan, Novta Dany'el, Wijono, Wijono, Setyawati, Onny |
---|---|
Format: | Article info application/pdf eJournal |
Bahasa: | eng |
Terbitan: |
LPPM INSTITUT TEKNOLOGI TELKOM PURWOKERTO
, 2017
|
Online Access: |
https://ejournal.st3telkom.ac.id/index.php/infotel/article/view/286 https://ejournal.st3telkom.ac.id/index.php/infotel/article/view/286/193 |
Daftar Isi:
- Missing value sering terjadi dalam metode klasifikasi dikarenakan informasi tentang obyek tidak diberikan, sulit dicari atau memang informasi tersebut tidak ada. Hal ini menyebabkan menurunnya keakuratan dan kualitas data pada saat data diolah. Pendekatan korelasi dilakukan karena peneliti harus mengetahui tentang ada tidaknya dan kuat lemahnya hubungan variable yang terkait dalam suatu objek atau subjek yang diteliti. Metode klasifikasi yang digunakan yaitu metode K-NN, karena metode ini termasuk metode klasifikasi yang memiliki konsistensi yang kuat. Metode ini mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama berdasarkan nilai K atau tertangga terdekat. Pendekatan korelasi dapat dilakukan untuk mengatasi missing value, terbukti dengan meningkatnya hasil klasifikasi dan hilangnya data yang belum terklasifikasi. Kuisioner berfungsi sebagai alat ukur, kuisioner berisi beberapa pertanyaan yang diberikan kepada responden, dari hasil kuisioner dilakukan analisa data untuk mengetahui tingkat korelasi data cadangan. Setelah mendapatkan tingkat korelasi data cadangan, maka data cadangan tersebut digunakan sebagai pengganti data yang terdapat missing value. Sebelum dilakukan penggantian data yang terdapat missing value, hasil klasifikasi dari 500 data adalah jurusan IPA sejumlah 88 siswa, jurusan IPS 126 siswa, jurusan bahasa 271 siswa, dan belum terklasifikasi/false 15 siswa. Setelah dilakukan penggantian data yang terdapat missing value, hasil klasifikasi dari 500 data adalah jurusan IPA berjumlah 102 siswa, jurusan IPS berjumlah 316 siswa, bahasa berjumlah 82 siswa, dan tidak ada data yang belum terklasifikasi. Berdasarkan hasil percobaan yang dilakukan nilai k = 3, 5, 7, 9, dan 11. Dapat diketahui nilai k = 5 memiliki tingkat akurasi yang tinggi dibandingkan dengan nilai k yang lain yaitu 97%, jadi dalam penelitian ini nilai k yang dipakai pada metode K-NN adalah 5
- Missing value often occur in classification method that is caused by information on the object is not given, it is difficult to find, or because of the information is unavailable. It will cause the decrement of accuracy and data quality during it is analyzed. Correlation approach was conducted because it should be known the existence and the strength of variable correlation in related to an object or subject studied. Classification method used is K-NN method. It is because this method is included in classification method that has strong consistency by finding the case through calculation on the closeness between the case with the old one based on K value or the nearest neighbor. Correlation approach can be done to overcome missing value, as evidenced by the increasing classification results and the loss of unclassified data. Questionnaire as a measuring tool, the questionnaire contains some questions given to the respondent, from the results of questionnaires conducted data analysis to determine the level of correlation of data backup. After getting the level of backup data correlation, then the backup data is used as a substitute for missing data value. Before the replacement of data there is missing value classification of 500 data classified natural science major 88 students, social science major 126 students, the language major 271 students, and unclassified / false 15 students. After the replacement of data there is missing value from 500 data, it can be classified into natural science major 102 students, social science major 316 students, the language major 82 students, and no unclassified data. Based on the experimental results, the value of k = 3, 5, 7, 9, and 11. It can be seen that k = 5 has a high accuracy of 97.0%, so in this study majors using K-NN method set k value used is 5.