MEMBANDINGKAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) DAN K-NEAREST NEIGHBOR (KNN) DALAM MEMBANGUN REPOSITORI AKRONIM-EKSPANSI DARI HALAMAN WEB SECARA OTOMATIS
Main Author: | Amir Mahazir |
---|---|
Format: | Bachelors |
Bahasa: | ind |
Online Access: |
http://etd.unsyiah.ac.id//index.php?p=show_detail&id=21537 |
Daftar Isi:
- Penyebaran dokumen web yang terus meningkat mengakibatkan kajian tentang ekstraksi informasi menjadi penting. Ekstraksi akronim secara otomatis merupakan salah satu kajian menantang dalam penambangan teks. Artikel ini membahas tentang ekstraksi akronim beserta ekspansinya dari dokumen web secara otomatis dan kemudian dimanfaatkan untuk membuat sebuah repositori. Istilah akronim mewakili seluruh bentuk penyingkatan kata baik yang dibaca berdasarkan huruf maupun suku kata. Untuk mendapatkan pasangan akronim dan ekspansi dari halaman web, mula-mula konten diekstraksi dari dokumen html, kemudian kandidat akronim dan ekspansi dibangun. Seluruh kandidat kemudian diklasifikasikan, pasangan akronim dan ekspansi yang benar disimpan ke dalam database. Metode klasifikasi Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN) dibandingkan untuk mendapatkan metode yang paling ampuh. Percobaan dilakukan dengan dokumen yang diperoleh dari enam situs web berbahasa Indonesia. Algoritma yang dikembangkan berhasil bekerja dengan baik dengan nilai akurasi F-measure mencapai 99,51% yang diperoleh dengan metode klasifikasi SVM dengan kernel polynomial.