Implementasi Word Embedding untuk Klasifikasi Sentimen pada User Feedback Menggunakan Random Forest Classifier
Main Author: | Gunawan, Yehezkiel |
---|---|
Format: | Thesis NonPeerReviewed application/pdf |
Bahasa: | eng |
Terbitan: |
, 2020
|
Subjects: | |
Online Access: |
http://kc.umn.ac.id/14164/1/HALAMAN_AWAL.pdf http://kc.umn.ac.id/14164/2/DAFTAR_PUSTAKA.pdf http://kc.umn.ac.id/14164/3/BAB_I.pdf http://kc.umn.ac.id/14164/4/BAB_II.pdf http://kc.umn.ac.id/14164/5/BAB_III.pdf http://kc.umn.ac.id/14164/6/BAB_IV.pdf http://kc.umn.ac.id/14164/7/BAB_V.pdf http://kc.umn.ac.id/14164/8/LAMPIRAN.pdf http://kc.umn.ac.id/14164/ |
ctrlnum |
14164 |
---|---|
fullrecord |
<?xml version="1.0"?>
<dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><relation>http://kc.umn.ac.id/14164/</relation><title>Implementasi Word Embedding untuk Klasifikasi Sentimen pada User Feedback Menggunakan Random Forest Classifier</title><creator>Gunawan, Yehezkiel</creator><subject>T58.5-58.64 Information technology</subject><description>User feedback menjadi suatu wadah bagi pengembang piranti lunak untuk mempelajari dan memahami kebutuhan, preferensi, dan keluh kesah pengguna. Penting bagi pengembang untuk mengidentifikasi persoalan muncul dalam feedback yang diberikan pengguna. Seiring dengan pertumbuhan dan perkembangan aplikasi, jumlah user pun semakin meningkat. Membaca dan mengklasifikasi setiap feedback secara manual memakan banyak waktu dan tenaga. Untuk mengatasi masalah tersebut, sistem analisis sentimen menggunakan Random Forest Classifier yang menggunakan word embedding sebagai feature extraction dibuat untuk membantu menentukan apakah suatu feedback memiliki sentimen positif, netral, atau negatif. Algoritma Random Forest dipilih karena performanya yang sangat bagus, meskipun membutuhkan resource yang agak besar. Selain itu, dengan bantuan word embedding, kata-kata yang memiliki kemiripan baik secara semantik maupun sintatik dapat terdeteksi dan diharapkan dapat memberikan performa yang lebih baik dibandingkan metode machine learning tradisional. Dengan bantuan word embedding, tidak lagi diperlukan stemming dan stop word removal agar konteks yang menjadi input dapat terbaca dengan baik. Penelitian ini bertujuan untuk mengimplementasikan word embedding untuk klasifikasi sentimen pada user feedback menggunakan Random Forest Classifier. Hasil implementasi yang paling ideal pada penelitian ini diperoleh ketika menggunakan dataset BYU (200 dimensi) sebagai Embedding Dataset dengan perbandingan train dan test set 80:20, yaitu akurasi sebesar 70.27%, precision sebesar 80%, recall sebesar 54%, dan F1 sebesar 54%.</description><date>2020</date><type>Thesis:Thesis</type><type>PeerReview:NonPeerReviewed</type><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/1/HALAMAN_AWAL.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/2/DAFTAR_PUSTAKA.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/3/BAB_I.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/4/BAB_II.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/5/BAB_III.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/6/BAB_IV.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/7/BAB_V.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/14164/8/LAMPIRAN.pdf</identifier><identifier> Gunawan, Yehezkiel (2020) Implementasi Word Embedding untuk Klasifikasi Sentimen pada User Feedback Menggunakan Random Forest Classifier. Bachelor Thesis thesis, Universitas Multimedia Nusantara. </identifier><recordID>14164</recordID></dc>
|
language |
eng |
format |
Thesis:Thesis Thesis PeerReview:NonPeerReviewed PeerReview File:application/pdf File |
author |
Gunawan, Yehezkiel |
title |
Implementasi Word Embedding untuk Klasifikasi Sentimen pada User Feedback Menggunakan Random Forest Classifier |
publishDate |
2020 |
topic |
T58.5-58.64 Information technology |
url |
http://kc.umn.ac.id/14164/1/HALAMAN_AWAL.pdf http://kc.umn.ac.id/14164/2/DAFTAR_PUSTAKA.pdf http://kc.umn.ac.id/14164/3/BAB_I.pdf http://kc.umn.ac.id/14164/4/BAB_II.pdf http://kc.umn.ac.id/14164/5/BAB_III.pdf http://kc.umn.ac.id/14164/6/BAB_IV.pdf http://kc.umn.ac.id/14164/7/BAB_V.pdf http://kc.umn.ac.id/14164/8/LAMPIRAN.pdf http://kc.umn.ac.id/14164/ |
contents |
User feedback menjadi suatu wadah bagi pengembang piranti lunak untuk mempelajari dan memahami kebutuhan, preferensi, dan keluh kesah pengguna. Penting bagi pengembang untuk mengidentifikasi persoalan muncul dalam feedback yang diberikan pengguna. Seiring dengan pertumbuhan dan perkembangan aplikasi, jumlah user pun semakin meningkat. Membaca dan mengklasifikasi setiap feedback secara manual memakan banyak waktu dan tenaga. Untuk mengatasi masalah tersebut, sistem analisis sentimen menggunakan Random Forest Classifier yang menggunakan word embedding sebagai feature extraction dibuat untuk membantu menentukan apakah suatu feedback memiliki sentimen positif, netral, atau negatif. Algoritma Random Forest dipilih karena performanya yang sangat bagus, meskipun membutuhkan resource yang agak besar. Selain itu, dengan bantuan word embedding, kata-kata yang memiliki kemiripan baik secara semantik maupun sintatik dapat terdeteksi dan diharapkan dapat memberikan performa yang lebih baik dibandingkan metode machine learning tradisional. Dengan bantuan word embedding, tidak lagi diperlukan stemming dan stop word removal agar konteks yang menjadi input dapat terbaca dengan baik. Penelitian ini bertujuan untuk mengimplementasikan word embedding untuk klasifikasi sentimen pada user feedback menggunakan Random Forest Classifier. Hasil implementasi yang paling ideal pada penelitian ini diperoleh ketika menggunakan dataset BYU (200 dimensi) sebagai Embedding Dataset dengan perbandingan train dan test set 80:20, yaitu akurasi sebesar 70.27%, precision sebesar 80%, recall sebesar 54%, dan F1 sebesar 54%. |
id |
IOS6965.14164 |
institution |
Universitas Multimedia Nusantara |
institution_id |
355 |
institution_type |
library:university library |
library |
Perpustakaan Universitas Multimedia Nusantara |
library_id |
306 |
collection |
Knowledge Center UMN |
repository_id |
6965 |
subject_area |
Business/Bisnis Communication/Komunikasi Art Apreciation/Apresiasi Seni Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika |
city |
TANGERANG |
province |
BANTEN |
shared_to_ipusnas_str |
1 |
repoId |
IOS6965 |
first_indexed |
2020-12-19T03:51:27Z |
last_indexed |
2020-12-19T03:51:27Z |
recordtype |
dc |
_version_ |
1686477463222222848 |
score |
17.538404 |