Question Classification Menggunakan Support Vector Machines dan Stemming

Main Authors: Abdiansah, Abdiansah Abdiansah, Winarko, Edi
Format: Article info application/pdf eJournal
Bahasa: eng
Terbitan: Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia , 2015
Online Access: http://journal.uii.ac.id/index.php/Snati/article/view/3529
http://journal.uii.ac.id/index.php/Snati/article/view/3529/3120
http://journal.uii.ac.id/index.php/Snati/article/downloadSuppFile/3529/58
Daftar Isi:
  • Abstract—Question Classification (QC) merupakan salah satukomponen penting dalam Question Answering System (QAS)karena akan berpengaruh langsung terhadap kinerjakeseluruhan QAS. Sejauh ini metode yang disarankan olehkomunitas QAS untuk QC adalah menggunakan SupportVector Machines (SVM). Untuk melakukan klasifikasi teksdibutuhkan fitur berdimensi tinggi, banyaknya fitur dapatmengurangi performa SVM. Stemming adalah teknik yangdigunakan untuk mereduksi term suatu dokumen.Penggunaan stemming akan berpengaruh terhadap sintaksisdan semantik suatu pertanyaan. Penelitian ini bertujuan untukmengetahui pengaruh stemming terhadap akurasi SVM. Telahdilakukan dua percobaan klasifikasi pertanyaan, yaitu denganmenggunakan SVM dan SVM+stemming. Hasil rata-rataakurasi dari percobaan diperoleh sebesar 86.75% untuk SVMdan 87.48% SVM+stemming sehingga telah terjadi kenaikanakurasi sebesar 0.73%. Walaupun peningkatan akurasi tidaksignifikan tetapi stemming dapat mereduksi fitur tanpamenurunkan akurasi SVM.Keywords—question classification, question answering system,support vector machines, stemming