Klasifikasi Berita Berbahasa Indonesia Dengan Algoritma Iterative Dichotomizer Tree

Main Author: Fahrobi,MohammadRulisk
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2012
Subjects:
Online Access: http://repository.ub.ac.id/152977/1/051201911.pdf
http://repository.ub.ac.id/152977/
Daftar Isi:
  • Perkembangan teknologi mengakibatkan penyampaian berita semakin beragam. Internet merupakan salah satu teknologi untuk penyampaian berita. Banyaknya dokumen berita diperlukan pengelompokan berita kedalam kategori. Dengan dibuatnya pengkategorian berita dapat memudahkan pembaca dalam mencari berita. Banyaknya dokumen berita mengakibatkan tidak bisa dilakukan pengkategorian berita secara manual. Text mining merupakan bagian dari data mining yang memiliki solusi untuk permasalahan tersebut. Iterative Dichotomizer Tree (ID3) adalah salah satu algoritma dalam data mining yang dapat menyelesaikan permasalahan tersebut. ID3 adalah algoritma pembangkitan pohon keputusan dan termasuk metode supervised learning karena memerlukan sejumlah data untuk proses pembelajaran. Penerapan ID3 dalam pengelompokan berita dapat diterapkan dengan melalui preprocessing , data fitur dan data transformasi. Transformasi data mengunakan distribusi frekuensi, karena ID3 tidak bisa membaca data numerik maka data numerik dirubah ke dalam data kategori. Hasil tertinggi dari perhitungan recall , precision dan f-measure pada perbandingan data latih 80 % dengan nilai recall 88.658333 %, precision 86.458333 % dan f-measure 86.608333 %. Dengan hasil pengujian ini maka algoritma ID3 dapat digunakan untuk pengklasifikasian berita berbahasa Indonesia.