Analisis Akurasi Metode Term Weighting Untuk Penilaian Otomatis Esai Berbahasa Indonesia Dengan K-Nearest Neighbor

Format: Bachelors
Terbitan: #CREATOR_ORGNAME# , 2018
Subjects:
ctrlnum ai-jbptppolban-gdl-harutdigda-8112
fullrecord <?xml version="1.0"?> <dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><title>Analisis Akurasi Metode Term Weighting Untuk Penilaian Otomatis Esai Berbahasa Indonesia Dengan K-Nearest Neighbor </title><subject>k-nearest neighbor, supervised term weighting, TF-Chi2, TF-RF, unsupervised term weighting, TF-IDF</subject><subject>k-nearest neighbor, supervised term weighting, TF-Chi2, TF-RF, unsupervised term weighting, TF-IDF</subject><publisher>#CREATOR_ORGNAME#</publisher><date>2018</date><language>Bahasa Indonesia</language><type>Thesis:Bachelors</type><identifier>jbptppolban-gdl-harutdigda-8112</identifier><description>Penilaian esai otomatis dapat menjadi solusi bagi permasalahan yang ada pada penilaian esai secara manual yaitu waktu pemeriksaan yang lama, tidak reliabel, dan tidak objektif. Penilaian esai otomatis dilakukan dengan cara melihat kemiripan antara esai yang akan dinilai dengan esai data latih yang telah diberikan label nilai oleh penilai manusia. Untuk menghitung kemiripan, setiap esai diubah menjadi bentuk vektor yang berisi bobot dari setiap term. Penelitian ini membandingkan hasil akurasi dari penggunaan 2 jenis metode pembobotan term yaitu unsupervised term weighting TF-IDF, dan supervised term weighting TF-Chi2 dan TF-RF. Penelitian ini menggunakan algoritma k-nearest neighbor sebagai metode machine learning. Terdapat 15 skenario eksperimen yang diujikan. Eksperimen dilakukan dengan menggunakan metode k-fold cross validation, dengan k bernilai 2 sampai 10. Hasil eksperimen terhadap 15 skenario memperlihatkan bahwa metode supervised term weighting selalu menghasilkan akurasi yang lebih baik dibandingkan metode unsupervised term weighting. Dengan rincian yaitu TF-Chi2 menjadi metode pembobotan term dengan akurasi terbaik pada 8 skenario, sedangkan TF-RF pada 7 skenario. Selisih hasil akurasi antara metode supervised term weighting dan unsupervised term weighting mencapai 14% pada dataset sejarah 1 rasio 1:1 dengan nilai k dari KNN bernilai 3. Dengan rincian yaitu metode TF-Chi2 menghasilkan akurasi 89,71%, metode TF-RF menghasilkan akurasi 88,07%, dan metode TF-IDF menghasilkan akurasi 74,93%. Walapun metode TF-Chi2 menjadi metode pembobotan term dengan akurasi terbaik pada 8 skenario, sedangkan TF-RF hanya pada 7 skenario, namun metode TF-RF memiliki performa yang lebih stabil dibandingkan TF-Chi2. Hal ini dibuktikan dengan hasil eksperimen pada skenario lainnya yaitu TF-Chi2 menjadi metode pembobotan dengan akurasi terendah pada 5 skenario, sedangkan TF-RF hanya pada 1 skenario. Oleh karena itu, metode pembobotan term yang direkomendasikan untuk digunakan dalam kasus penilaian esai otomatis dengan k-nearest neighbor adalah metode TF-RF dengan nilai k dari KNN bernilai 3. Kata Kunci: k-nearest neighbor, supervised term weighting, TF-Chi2, TF-RF, unsupervised term weighting, TF-IDF.</description><recordID>ai-jbptppolban-gdl-harutdigda-8112</recordID></dc>
format Thesis:Bachelors
Thesis
title Analisis Akurasi Metode Term Weighting Untuk Penilaian Otomatis Esai Berbahasa Indonesia Dengan K-Nearest Neighbor
publisher #CREATOR_ORGNAME#
publishDate 2018
topic k-nearest neighbor
supervised term weighting
TF-Chi2
TF-RF
unsupervised term weighting
TF-IDF
contents Penilaian esai otomatis dapat menjadi solusi bagi permasalahan yang ada pada penilaian esai secara manual yaitu waktu pemeriksaan yang lama, tidak reliabel, dan tidak objektif. Penilaian esai otomatis dilakukan dengan cara melihat kemiripan antara esai yang akan dinilai dengan esai data latih yang telah diberikan label nilai oleh penilai manusia. Untuk menghitung kemiripan, setiap esai diubah menjadi bentuk vektor yang berisi bobot dari setiap term. Penelitian ini membandingkan hasil akurasi dari penggunaan 2 jenis metode pembobotan term yaitu unsupervised term weighting TF-IDF, dan supervised term weighting TF-Chi2 dan TF-RF. Penelitian ini menggunakan algoritma k-nearest neighbor sebagai metode machine learning. Terdapat 15 skenario eksperimen yang diujikan. Eksperimen dilakukan dengan menggunakan metode k-fold cross validation, dengan k bernilai 2 sampai 10. Hasil eksperimen terhadap 15 skenario memperlihatkan bahwa metode supervised term weighting selalu menghasilkan akurasi yang lebih baik dibandingkan metode unsupervised term weighting. Dengan rincian yaitu TF-Chi2 menjadi metode pembobotan term dengan akurasi terbaik pada 8 skenario, sedangkan TF-RF pada 7 skenario. Selisih hasil akurasi antara metode supervised term weighting dan unsupervised term weighting mencapai 14% pada dataset sejarah 1 rasio 1:1 dengan nilai k dari KNN bernilai 3. Dengan rincian yaitu metode TF-Chi2 menghasilkan akurasi 89,71%, metode TF-RF menghasilkan akurasi 88,07%, dan metode TF-IDF menghasilkan akurasi 74,93%. Walapun metode TF-Chi2 menjadi metode pembobotan term dengan akurasi terbaik pada 8 skenario, sedangkan TF-RF hanya pada 7 skenario, namun metode TF-RF memiliki performa yang lebih stabil dibandingkan TF-Chi2. Hal ini dibuktikan dengan hasil eksperimen pada skenario lainnya yaitu TF-Chi2 menjadi metode pembobotan dengan akurasi terendah pada 5 skenario, sedangkan TF-RF hanya pada 1 skenario. Oleh karena itu, metode pembobotan term yang direkomendasikan untuk digunakan dalam kasus penilaian esai otomatis dengan k-nearest neighbor adalah metode TF-RF dengan nilai k dari KNN bernilai 3. Kata Kunci: k-nearest neighbor, supervised term weighting, TF-Chi2, TF-RF, unsupervised term weighting, TF-IDF.
id IOS17601.ai-jbptppolban-gdl-harutdigda-8112
institution Politeknik Negeri Bandung
institution_id 2033
institution_type library:university
library
library UPT Perpustakaan Politeknik Negeri Bandung
library_id 1640
collection Repository Polban
repository_id 17601
city BANDUNG BARAT
province JAWA BARAT
repoId IOS17601
first_indexed 2022-08-31T03:16:59Z
last_indexed 2022-08-31T03:16:59Z
recordtype dc
_version_ 1742648123222654976
score 17.538404