Klarifikasi beban baca berdasarkan lexile levels menggunakan metode K-Means clustering dan Naive Bayes multinomial / Muhammad Fahmi Hidayat
Main Author: | Hidayat, Muhammad Fahmi |
---|---|
Format: | Thesis NonPeerReviewed |
Terbitan: |
, 2019
|
Online Access: |
http://repository.um.ac.id/152148/ |
Daftar Isi:
- RINGKASANHidayatMuhammadFahmi.2019.KlasifikasiBebanBacaBerdasarkanLexileLevelsMenggunakanMetodeK-MeansClusteringdanNaiveBayesMultinomial.SkripsiProgramstudiS1TeknikInformatikaJurusanElektroFakultasTeknikUniversitasNegeriMalang.Pembimbing(I)UtomoPujiantoS.Kom.M.Kom.(II)HaritsArRosyidS.T.MT.Ph.D.KataKunciKlasifikasiTeksBahanBacaanPengklasteranK-MeansClusteringNaiveBayesMultinomial.Membacamerupakansuatuhalyangpentingdalamprosesperkembanganpendidikanseseorang.Meskipunbegitusetiaporangmemilikikemampuanbacayangberbeda-bedahalinimenjadisuatumasalahketikakompleksitasbahanbacaanmelebihikemampuanbaca.Untukmembantupermasalahaniniterdapatsolusiyangtelahditawarkansalahsatunyaadalahdenganpengelompokanbahanbacaanmenggunakanlexilelevels.Lexilelevelsmerupakannotasinumerikyangmerepresentasikankemampuanbacaseseorangdantingkatkesulitansuatubahanbacaan.Denganlexilelevelspembacamenjadilebihmudahdalammemilihbahanbacaanyangsesuaidengankemampuanbacayangdimiliki.Sayangnyametodeyangdigunakanuntukpenentuannilailexilelevelstidakdibukauntukumumsehinggapenggunadiharuskanuntukberlanggananterlebihdahulupadapenyedialayanan.Olehkarenaitupenelitianinibertujuanuntukmembuatsuatusistemyangdiharapkanmampumelakukanpengelompokandanpenentuantingkatkesulitansuatubahanbacaansecarasederhanaberdasarkanbahanbacayangtelahmemilikilexilelevels.Penelitianinidimulaidenganpengambilandatadarisitustweentribune.com.Adapundatayangdiambiladalahjudulartikelisiartikeldannilailexilelevel.Setelahpengambilandataprosesberlanjutpadatahapclustering.DalamtahapclusteringmetodeK-meansClusteringdigunakanuntukmengklasternilailexilelevelskedalambentukyanglebihsederhana.Padapenelitianiniprosesclusteringdilakukansebanyakduakalidengankomposisik2yangberisiklasterEasydanDifficultdank3yangberisiklasterEasyNormaldanDifficult.SelanjutnyamelakukanpreprocessingterhadapdatasetyaitutokenisasipenghapusanstopwordstemmingdanpembobotantokenmenggunakanTF-IDF.SetelahtahappreprocessingselesaiprosesoversamplingdilakukanuntukmengatasidistribusiklasteryangtidakseimbangmenggunakanmetodeSMOTE(SyntheticMinorityOver-SamplingTechnique).DariseluruhhasilpemrosesantersebutklasifikasiteksdilakukanuntukmenentukanbebanbacamenggunakanalgoritmaNaiveBayesMultinomial.Hasildaripenelitianinimenunjukkanbahwaprosesklasifikasimenggunakan2klasterdengandilakukanoversamplingmenghasilkantingkatakurasirecalldanpresisiyangpalingtinggiyaitu84%.Sementarahasilklasifikasimenggunakan2klastertanpadisertaioversamplingmenunjukkannilaiakurasidanrecallsebesar71%.Hasilyangcukupbaikjugaditunjukkanpadaklasifikasimenggunakan3klasterdisertaioversamplingdengannilaiakurasidanrecallsebesar78%.Namunhasilklasifikasimenggunakan3klastertanpadisertaioversamplingmenunjukkannilaiakurasidanrecallyangpalingrendahdengan53%.