Question Classification Menggunakan Support Vector Machines dan Stemming
Main Authors: | Abdiansah, Abdiansah Abdiansah, Winarko, Edi |
---|---|
Format: | Article info application/pdf eJournal |
Bahasa: | eng |
Terbitan: |
Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia
, 2015
|
Online Access: |
http://journal.uii.ac.id/index.php/Snati/article/view/3529 http://journal.uii.ac.id/index.php/Snati/article/view/3529/3120 http://journal.uii.ac.id/index.php/Snati/article/downloadSuppFile/3529/58 |
Daftar Isi:
- Abstract—Question Classification (QC) merupakan salah satukomponen penting dalam Question Answering System (QAS)karena akan berpengaruh langsung terhadap kinerjakeseluruhan QAS. Sejauh ini metode yang disarankan olehkomunitas QAS untuk QC adalah menggunakan SupportVector Machines (SVM). Untuk melakukan klasifikasi teksdibutuhkan fitur berdimensi tinggi, banyaknya fitur dapatmengurangi performa SVM. Stemming adalah teknik yangdigunakan untuk mereduksi term suatu dokumen.Penggunaan stemming akan berpengaruh terhadap sintaksisdan semantik suatu pertanyaan. Penelitian ini bertujuan untukmengetahui pengaruh stemming terhadap akurasi SVM. Telahdilakukan dua percobaan klasifikasi pertanyaan, yaitu denganmenggunakan SVM dan SVM+stemming. Hasil rata-rataakurasi dari percobaan diperoleh sebesar 86.75% untuk SVMdan 87.48% SVM+stemming sehingga telah terjadi kenaikanakurasi sebesar 0.73%. Walaupun peningkatan akurasi tidaksignifikan tetapi stemming dapat mereduksi fitur tanpamenurunkan akurasi SVM.Keywords—question classification, question answering system,support vector machines, stemming