Klasifikasi Jenis Pantun Dengan Metode Support Vector Machines (SVM)
Main Authors: | Irmanda, Helena Nurramdhani, Ria Astriratma |
---|---|
Format: | Article info application/pdf Journal |
Bahasa: | eng |
Terbitan: |
Ikatan Ahli Informatika Indonesia (IAII)
, 2020
|
Subjects: | |
Online Access: |
http://jurnal.iaii.or.id/index.php/RESTI/article/view/2313 http://jurnal.iaii.or.id/index.php/RESTI/article/view/2313/322 |
Daftar Isi:
- This study aims to create a model for categorizing pantun types and analyze the accuracy of support vector machines (SVM). The first stage is collecting pantun that have been labeled with pantun category. The pantun categories consist of pantun for children, pantun for young people, and pantun for elder. After collecting data, the next stage is pre-processing. This pre-processing stage makes data ready to be processed on the extraction stage. The pre-processing stage consists of text segmentation, case folding, tokenization, stop word removal, and stemming. The feature extraction stage is intended to analyze potential information and represent terms as a vector. Separating training data and testing data is necessary to be conducted before the classification process. Then the classification process is done by using multiclass SVM. The results of the classification are evaluated to obtain accuracy and will be analyzed whether the classification model is proper to be used. The results showed that SVM classified the types of pantun with accuracy of 81,91%.
- Penelitian ini bertujuan untuk membuat model untuk mengkategorikan jenis pantun dan menganalisis hasil akurasi dari metode support vector machines (SVM). Tahapan penelitian diawali dengan pengumpulan data yaitu dataset pantun yang sudah dilabeli dengan jenis pantunnya masing-masing. Dataset pantun yang digunakan terdiri atas tiga kategori yaitu pantun anak-anak, pantun muda, dan pantun orang tua. Setelah data terkumpul, dilakukan tahap pra proses. Tahap pra proses ini bertujuan untuk membuat data sehingga siap untuk diolah di tahapan ekstraksi fitur. Tahap pra proses terdiri atas text segmentation, case folding, tokenization, stopword removal, dan stemming. Tahapan ekstraksi fitur mempunyai tujuan menggali informasi potensial serta merepresentasikan kata-kata sebagai vektor fitur. Tahapan selanjutnya yaitu memisahkan data latih dan data uji. Kemudian pada proses klasifikasi dilakukan dengan menggunakan metode multiclass SVM untuk mendapatkan hasil akhir dari pembuatan sistem. Hasil klasifikasi kemudian dievaluasi untuk mendapatkan nilai akurasi dan akan dianalisis apakah model klasifikasi yang dibuat layak digunakan. Hasil penelitian menunjukkan bahwa SVM dapat dengan baik mengklasifikasi jenis pantun dengan akurasi sebesar 81,91%.