KLASIFIKASI TEKS MENGGUNAKAN LONG SHORT-TERM MEMORY DENGAN FITUR WORD EMBEDDING GLOVE DAN WORD2VEC
Daftar Isi:
- Klasifikasi teks multilabel adalah tugas mengategorikan teks ke dalam satu atau lebih kategori. Seperti pembelajaran mesin lainnya, kinerja klasifikasi multilabel terbatas ketika ada data kecil berlabel. Dibutuhkan teknik klasifikasi teks multilabel yang dapat mengelompokkan artikel berita. Deep Learning adalah metode yang diusulkan untuk memecahkan masalah dalam teknik klasifikasi teks multilabel. Beberapa contoh metode deep learning yang digunakan untuk pengklasifikasian teks antara lain CNN, Autoencoder, Deep Belief Networks, dan Recurrent Neural Networks (RNN). RNN merupakan salah satu arsitektur yang paling popular yang digunakan dalam Pemrosesan Bahasa Alami karena struktur recurrent cocok untuk proses teks variabel panjang. Salah satu metode deep learning yang diusulkan pada penelitian ini adalah RNN dengan penerapan arsitektur Long Short-Term Memory (LSTM). Dengan dilakukan tuning parameter LSTM menggunakan fitur GloVe dan Word2vec akan membuat model menjadi delapan model, gunanya untuk menunjukkan bahwa LSTM dengan fitur tambahan dapat mencapai kinerja yang baik dalam klasifikasi teks. Hasil penelitian menunjukkan bahwa klasifikasi teks menggunakan LSTM dengan Glove memperoleh akurasi tertinggi pada model keenam dengan 95,17% dan Word2Vec memperoleh akurasi tertinggi pada model kelima dengan 95,38%, sedangkan rata-rata nilai presisi, recall, dan F1-score adalah 95%.