Klasifikasi Pertanyaan untuk Question Answering System Bahasa Indonesia Menggunakan Support Vector Machine Berdasarkan Taksonomi Li & Roth

Main Authors: Al-Hadiid, Muhammad Faiz, Putra Pandu Adikar, S.Kom., M.Kom.,, Yuita Arum Sari, S.Kom., M.Kom.,
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2020
Subjects:
Online Access: http://repository.ub.ac.id/id/eprint/193587/1/0520150362%20-%20Muhammad%20Faiz%20Al-Hadiid.pdf
http://repository.ub.ac.id/id/eprint/193587/
Daftar Isi:
  • Question Answering System (QAS) adalah sistem yang secara otomatis dapat menjawab pertanyaan yang diberikan oleh pengguna. Salah satu bagian penting dari QAS adalah klasifikasi pertanyaan yang bertujuan untuk mendapatkan expected answer type (EAT) dari suatu pertanyaan. Penelitian klasifikasi pertanyaan bahasa Indonesia sudah pernah dilakukan sebelumnya. Namun, belum ada yang melakukan klasifikasi berdasarkan taksonomi Li & Roth yang terdiri dari 6 coarse class dan 50 fine class. Penelitian untuk mendapatkan sistem klasifikasi pertanyaan yang lebih baik perlu dilakukan. Penelitian ini menggunakan metode klasifikasi Support Vector Machine (SVM) dengan kernel linier dan strategi one-against-all. Selain itu, digunakan beberapa proses ekstraksi fitur berupa ekstraksi bag-of-words, kata tanya, bentuk kata dan POS-tag. Ekstraksi fitur adalah proses yang pertama kali dilakukan untuk mengekstrak informasi penting dari data. Tahap berikutnya adalah membentuk model klasifikasi coarse dan fine menggunakan SVM. Berdasarkan hasil pengujian, pada coarse class didapatkan nilai accuracy sebesar 0,81508, precision sebesar 0,82714, recall sebesar 0,79566, dan f-measure sebesar 0,80326 dengan parameter berupa C=1,5, tol=0,01, dan iterasi maksimum=2000. Selain itu, didapatkan juga hasil evaluasi pada fine class yaitu nilai accuracy sebesar 0,66379, precision sebesar 0,63975, recall sebesar 0,62192, dan f-measure sebesar 0,61166 dengan parameter berupa C=0,5, tol=0,01, dan iterasi maksimum=500. Berdasarkan pengujian kata tanya, didapatkan kata tanya “kapan” sebagai kata tanya dengan akurasi terbesar sebesar 1 dan kata tanya “apa” sebagai kata tanya dengan akurasi terkecil sebesar 0,7193.