Analisis perbaikan data hilang dengan imputasi berbasis K-Nearest neighbor / Della Murbarani Prawidya Murti

Main Author: Murti, Della Murbarani Prawidya
Format: Thesis NonPeerReviewed
Terbitan: , 2019
Online Access: http://repository.um.ac.id/99068/
Daftar Isi:
  • RINGKASANMurtiDellaMurbaraniPrawidya.2019.AnalisisPerbaikanDataHilangDenganImputasiBerbasisK-NearestNeighbor.SkripsiJurusanTeknikElektroFakultasTeknikUniversitasNegeriMalangPembimbing(I)AjiPrasetyaWibawaS.T.M.M.T.Ph.D.KataKuncimissingdataimputasiimputasiK-NearestNeighborKlasifikasiNaiveBayesKlasifikasiK-NNSalahsatupermasalahanyangterjadidalamdataminingadalahadanyamissingdata.Missingdatadapatdiartikansebagaisuatukeadaandimanaterdapatnilaiyangkosongatausuatuinformasiyangtidaktersediadalamsuatudata.Terdapatbeberapateknikyangdapatdilakukanuntukmengatasimissingdatasalahsatunyadenganmengestimasinilaiatauimputasidata.Imputasimerupakanmetodeyangdigunakanuntukmengisinilaiyanghilangdengannilaiyangberdasarkandariinformasipadasuatudataset.PenangananmissingdatadenganmenggunakanmetodeK-NNsudahbukanhalyangbarukarenametodeinimerupakanmetodeyangsederhanadanfleksibelbaikpadakontinumaupundatadiskrit.MetodeK-NNbekerjadenganmemperkirakannilaiyangdidapatkandaritetanggaterdekatmenggunakanjarakEuclidian.Penelitianinibertujuanuntukmengestimasinilaiyanghilangpadasuatudatadenganbeberapasimulasimissingdataberdasarkannilaiyangdiambildaritetanggaterdekat.PengukurankinerjametodeK-NNdilakukandenganmengklasifikasikandataimputasimenggunakanalgoritmaNaiveBayesdanK-NNdenganparameterk5.Sementaraevaluasidilakukanberdasarkanselisihakurasiyangdihasilkan.BerdasarkanpenelitianyangtelahdilakukanmenunjukkanbahwametodeK-NNdapatmenanganimissingdata.Setiapalgoritmaklasifikasimenunjukkanakurasihasilimputasidenganparameterkyangberbeda.ParameterkterbaikhasilimputasidenganalgoritmaNaiveBayesyaknipadak5sedangkanparameterkterbaikhasilimputasidenganalgoritmaK-NNyaknipadak1dank3.WalaupunterdapatperbedaanmetodeK-NNmampudigunakansebagaiimputasidenganhasilyangmendekatiakurasidatasebenarnyadenganbeberapakasusmissingdatayangdiberikansertapengujianpadaalgoritmayangberbeda.