Klarifikasi beban baca berdasarkan lexile levels menggunakan metode K-Means clustering dan Naive Bayes multinomial / Muhammad Fahmi Hidayat

Main Author: Hidayat, Muhammad Fahmi
Format: Thesis NonPeerReviewed
Terbitan: , 2019
Online Access: http://repository.um.ac.id/152148/
Daftar Isi:
  • RINGKASANHidayatMuhammadFahmi.2019.KlasifikasiBebanBacaBerdasarkanLexileLevelsMenggunakanMetodeK-MeansClusteringdanNaiveBayesMultinomial.SkripsiProgramstudiS1TeknikInformatikaJurusanElektroFakultasTeknikUniversitasNegeriMalang.Pembimbing(I)UtomoPujiantoS.Kom.M.Kom.(II)HaritsArRosyidS.T.MT.Ph.D.KataKunciKlasifikasiTeksBahanBacaanPengklasteranK-MeansClusteringNaiveBayesMultinomial.Membacamerupakansuatuhalyangpentingdalamprosesperkembanganpendidikanseseorang.Meskipunbegitusetiaporangmemilikikemampuanbacayangberbeda-bedahalinimenjadisuatumasalahketikakompleksitasbahanbacaanmelebihikemampuanbaca.Untukmembantupermasalahaniniterdapatsolusiyangtelahditawarkansalahsatunyaadalahdenganpengelompokanbahanbacaanmenggunakanlexilelevels.Lexilelevelsmerupakannotasinumerikyangmerepresentasikankemampuanbacaseseorangdantingkatkesulitansuatubahanbacaan.Denganlexilelevelspembacamenjadilebihmudahdalammemilihbahanbacaanyangsesuaidengankemampuanbacayangdimiliki.Sayangnyametodeyangdigunakanuntukpenentuannilailexilelevelstidakdibukauntukumumsehinggapenggunadiharuskanuntukberlanggananterlebihdahulupadapenyedialayanan.Olehkarenaitupenelitianinibertujuanuntukmembuatsuatusistemyangdiharapkanmampumelakukanpengelompokandanpenentuantingkatkesulitansuatubahanbacaansecarasederhanaberdasarkanbahanbacayangtelahmemilikilexilelevels.Penelitianinidimulaidenganpengambilandatadarisitustweentribune.com.Adapundatayangdiambiladalahjudulartikelisiartikeldannilailexilelevel.Setelahpengambilandataprosesberlanjutpadatahapclustering.DalamtahapclusteringmetodeK-meansClusteringdigunakanuntukmengklasternilailexilelevelskedalambentukyanglebihsederhana.Padapenelitianiniprosesclusteringdilakukansebanyakduakalidengankomposisik2yangberisiklasterEasydanDifficultdank3yangberisiklasterEasyNormaldanDifficult.SelanjutnyamelakukanpreprocessingterhadapdatasetyaitutokenisasipenghapusanstopwordstemmingdanpembobotantokenmenggunakanTF-IDF.SetelahtahappreprocessingselesaiprosesoversamplingdilakukanuntukmengatasidistribusiklasteryangtidakseimbangmenggunakanmetodeSMOTE(SyntheticMinorityOver-SamplingTechnique).DariseluruhhasilpemrosesantersebutklasifikasiteksdilakukanuntukmenentukanbebanbacamenggunakanalgoritmaNaiveBayesMultinomial.Hasildaripenelitianinimenunjukkanbahwaprosesklasifikasimenggunakan2klasterdengandilakukanoversamplingmenghasilkantingkatakurasirecalldanpresisiyangpalingtinggiyaitu84%.Sementarahasilklasifikasimenggunakan2klastertanpadisertaioversamplingmenunjukkannilaiakurasidanrecallsebesar71%.Hasilyangcukupbaikjugaditunjukkanpadaklasifikasimenggunakan3klasterdisertaioversamplingdengannilaiakurasidanrecallsebesar78%.Namunhasilklasifikasimenggunakan3klastertanpadisertaioversamplingmenunjukkannilaiakurasidanrecallyangpalingrendahdengan53%.