Klasifikasi Berita Berbahasa Indonesia Berbasis Multi-Word Menggunakan Metode Multinomial Naive Bayes (Mnb)
Main Author: | Yaenudin, MuhamadArief |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2012
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/153039/1/Laporan.pdf http://repository.ub.ac.id/153039/ |
Daftar Isi:
- Berita sudah menjadi kebutuhan masyarakat Indonesia sehari–hari. Berita yang disajikan dalam bentuk media online berupa dokumen yang jumlahnya sangat banyak dan sulit sekali jika dokumen – dokumen berita tersebut diklasifikasikan secara manual Penelitian ini membahas mengenai penerapan klasifikasi berita berbahasa Indonesia berbasis multi-word menggunakan metode Multinomial Naive Bayes(MNB), dimana dokumen yang digunakan berasal dari situs media online surat kabar Kompas.com. Tahapan-tahapan yang dilakukan dalam sistem ini adalah, pertama dilakukan proses parsing kalimat yaitu memotong suatu dokumen menjadi kalimat-kalimat penyusunnya, tahap kedua yaitu melakukan proses Preprocessing yang memiliki sub proses case folding yaitu mengubah semua huruf menjadi huruf kecil, tokenizing yaitu proses penguraian kata, filtering yaitu mengambil kata-kata yang penting/relevan dan penghilangan stopword, stemming mereduksi kata ke bentuk dasarnya, tahap ketiga ekstraksi multi-word yaitu menemukan multi-word dari setiap dokumen , tahap keempat yaitu melakukan perhitungan frekuensi dari masing-masing multi-word, dan tahap terakhir yaitu klasifikasi menggunakan metode MNB (Multinomial Naïve Bayes). Hasil pengujian dan evaluasi menunjukkan bahwa sistem ini menghasilkan nilai rata-rata precision sebesar 0.840, rata-rata recall sebesar 0.7 dan rata-rata F1 measure sebesar 0.705714. Evaluasi dilakukan untuk mengetahui pengaruh jumlah data latih terhadap efektifitas dari sistem.