Implementasi Algoritma Random Forest Menggunakan TF-IDF untuk Analisis Sentimen dengan Penerapan Transfer Learning
Main Author: | Qalbi Fajar Islami, Ahsanul |
---|---|
Format: | Thesis NonPeerReviewed application/pdf |
Bahasa: | eng |
Terbitan: |
, 2020
|
Subjects: | |
Online Access: |
http://kc.umn.ac.id/14479/1/HALAMAN_AWAL.pdf http://kc.umn.ac.id/14479/2/DAFTAR_PUSTAKA.pdf http://kc.umn.ac.id/14479/3/BAB_I.pdf http://kc.umn.ac.id/14479/4/BAB_II.pdf http://kc.umn.ac.id/14479/5/BAB_III.pdf http://kc.umn.ac.id/14479/6/BAB_IV.pdf http://kc.umn.ac.id/14479/7/BAB_V.pdf http://kc.umn.ac.id/14479/8/LAMPIRAN.pdf http://kc.umn.ac.id/14479/ |
Daftar Isi:
- Penelitian ini melakukan pembahasan mengenai penerapan salah satu algoritma machine learning, yaitu Random Forest yang digunakan untuk melakukan klasifikasi teks menjadi dua kategori, yaitu positif dan negatif dengan menggunakan Term Frequency-Inverse Document Frequency (TF-IDF) sebagai metode untuk mengubah teks berupa bahasa sehari-hari atau natural language menjadi vektor representasi. Penelitian ini menggunakan dataset berupa ulasan dari pengguna kepada Perusahaan Amazon, Yelp, dan IMDB. Pada penerapan nya, penelitian ini menggunakan metode transfer learning untuk mengirimkan informasi yang didapatkan oleh model dari dataset yang telah di-training sebelumnya sebagai starting point untuk dataset selanjutnya pada proses training. Transfer learning yang diterapkan adalah transfer learning feature importances, yaitu dengan menggunakan informasi yang didapat dari model yang telah di-training sebelumnya berupa fitur atau term apa saja yang dianggap penting atau memiliki nilai feature importance lebih dari nol untuk dijadikan fitur atau term training pada dataset selanjutnya. Tujuan metode ini adalah untuk mengurangi fitur atau term pada dataset selanjutnya dan hanya mengambil fitur atau term yang berpengaruh saja. Pada penelitian ini juga menerapkan metode transfer learning dengan mengirim nilai frekuensi dokumen yang mengandung suatu term pada dataset selanjutnya yang akan di-training. Tujuan dari metode ini adalah untuk mengubah nilai IDF suatu fitur atau term dengan informasi dari model dengan dataset yang lebih besar dari dataset untuk membangun model selanjutnya agar dapat mengubah nilai kepentingan suatu term dengan informasi dari dataset yang lebih besar. Dengan penelitian ini diharapkan dapat mengetahui apakah penerapan metode transfer learning dapat memberikan hasil yang positif untuk melakukan klasifikasi sentimen menggunakan algoritma Random Forest, dan memberikan fasilitas untuk masyarakat untuk mengetahui sentimen dari suatu kalimat.