Penerapan metode cosine similarity dengan pengurangan konten judul dan abstrak berbasis frequency untuk klasifikasi artikel jurnal / Piska Dwi Nurfadila

Main Author: Nurfadila, Piska Dwi
Format: Thesis NonPeerReviewed
Terbitan: , 2019
Online Access: http://repository.um.ac.id/99033/
Daftar Isi:
  • RINGKASANPiskaDwiNurfadila.2019.PenerapanMetodeCosineSimilaritydenganPenguranganKontenJuduldanAbstrakBerbasisFrequencyuntukKlasifikasiArtikelJurnal.Skripsi.JurusanTeknikElektroFakultasTeknikUniversitasNegeriMalang.Pembimbing.(I)AjiPrasetyaWibawaS.T.M.M.T.Ph.D.(II)IlhamAriElbaithZaeniS.T.M.T.Ph.D.KeywordsKlasifikasitextStopwordremovalFrequencyCosineSimilarityK-FoldCrossValidationPencarianinformasidarisekumpulandokumenberupatextdapatdilakukandenganmenggunakanmetodeklasifikasi.Sebelumdiklasifikasikandokumenakanmelaluitahappre-processing.Beberapatahappre-processingyaitumengubahhurufkapitalmenjadihurufkecilmenghilangkanangkadantandabacastopwordremovaldanstemming.Daribeberapatahapanpre-processingyangseringdigunakanadalahstopwordremoval.Padapenelitianinimembandingkankinerjametodecosinesimilaritytanpamenerapkantahapstopwordremovaldenganmetodecosinesimilarityyangmenambahkantahappenghapusankataberdasarkanfrequency.Untukmenentukanbatasfrequencypalingtepatdilakukanempatskenariopenghapusankata.Skenariopertamapengapusankatadarinilaiterkecilskenariokeduapengapusankatadarinilaiterbesarskenarioketigapenghapusankatadarinilaitengahdanskenariokeempatpenghapusankatadarinilailebihdaridankurangdari.Percobaanyangdilakukanpadatiapskenarioberbeda-beda.PengujiankinerjametodedilakukandenganmenggunakanK-foldCrossValidationdenganoutputberupanilaiaccuracyprecisiondanrecall.Selainitujugadihitungperbandingannilaiexecutiontimedarikeduapenelitian.Hasilpenelitianinimenunjukkannilaiaccuracytertinggiyangdihasilkansebesar6428%.Peningkatankinerjanilaiaccuracydaripenelitiansebelumnyakuranglebihsebesar4%.Executiontimeyangdibutuhkanpadatahappre-processingyaitu59406seconds.Untukexecutiontimepadatahapklasifikasilebihcepatyaitu005302seconds.