Analisis perbaikan data hilang dengan imputasi berbasis K-Nearest neighbor / Della Murbarani Prawidya Murti
Main Author: | Murti, Della Murbarani Prawidya |
---|---|
Format: | Thesis NonPeerReviewed |
Terbitan: |
, 2019
|
Online Access: |
http://repository.um.ac.id/99068/ |
Daftar Isi:
- RINGKASANMurtiDellaMurbaraniPrawidya.2019.AnalisisPerbaikanDataHilangDenganImputasiBerbasisK-NearestNeighbor.SkripsiJurusanTeknikElektroFakultasTeknikUniversitasNegeriMalangPembimbing(I)AjiPrasetyaWibawaS.T.M.M.T.Ph.D.KataKuncimissingdataimputasiimputasiK-NearestNeighborKlasifikasiNaiveBayesKlasifikasiK-NNSalahsatupermasalahanyangterjadidalamdataminingadalahadanyamissingdata.Missingdatadapatdiartikansebagaisuatukeadaandimanaterdapatnilaiyangkosongatausuatuinformasiyangtidaktersediadalamsuatudata.Terdapatbeberapateknikyangdapatdilakukanuntukmengatasimissingdatasalahsatunyadenganmengestimasinilaiatauimputasidata.Imputasimerupakanmetodeyangdigunakanuntukmengisinilaiyanghilangdengannilaiyangberdasarkandariinformasipadasuatudataset.PenangananmissingdatadenganmenggunakanmetodeK-NNsudahbukanhalyangbarukarenametodeinimerupakanmetodeyangsederhanadanfleksibelbaikpadakontinumaupundatadiskrit.MetodeK-NNbekerjadenganmemperkirakannilaiyangdidapatkandaritetanggaterdekatmenggunakanjarakEuclidian.Penelitianinibertujuanuntukmengestimasinilaiyanghilangpadasuatudatadenganbeberapasimulasimissingdataberdasarkannilaiyangdiambildaritetanggaterdekat.PengukurankinerjametodeK-NNdilakukandenganmengklasifikasikandataimputasimenggunakanalgoritmaNaiveBayesdanK-NNdenganparameterk5.Sementaraevaluasidilakukanberdasarkanselisihakurasiyangdihasilkan.BerdasarkanpenelitianyangtelahdilakukanmenunjukkanbahwametodeK-NNdapatmenanganimissingdata.Setiapalgoritmaklasifikasimenunjukkanakurasihasilimputasidenganparameterkyangberbeda.ParameterkterbaikhasilimputasidenganalgoritmaNaiveBayesyaknipadak5sedangkanparameterkterbaikhasilimputasidenganalgoritmaK-NNyaknipadak1dank3.WalaupunterdapatperbedaanmetodeK-NNmampudigunakansebagaiimputasidenganhasilyangmendekatiakurasidatasebenarnyadenganbeberapakasusmissingdatayangdiberikansertapengujianpadaalgoritmayangberbeda.