Klasifikasi Berita pada Media Online Menggunakan Pembobotan Kata Berbasis Term Frequency

Main Author: Bagaskara Khatulistiwa
Format: PeerReviewed eJournal
Bahasa: ind
Terbitan: SKRIPSI Jurusan Teknik Elektro - Fakultas Teknik UM , 2018
Online Access: http://karya-ilmiah.um.ac.id/index.php/TE/article/view/77705
Daftar Isi:
  • RINGKASANBerita adalah suatu kejadian yang dikemas dalam bentuk informasi kemudian disebarkan dalam bentuk siaran, cetak, mulut ke mulut, ataupun melalui internet. Dengan menggunakan internet, penyebaran berita dapat dilakukan dengan mudah dan lebih cepat. Banyaknya berita yang bertambah di internet tiap bulannya, menyebabkan banyak berita belum terklasifikasi sesuai dengan isi berita. Untuk mengatasi masalah tersebut, diperlukan aplikasi yang dapat melakukan klasifikasi sesuai dengan isi berita. Penelitian ini bertujuan untuk mengembangkan sistem klasifikasi konten berita menggunakan text mining.Text Mining merupakan teknik data mining untuk melakukan klasifikasi data berupa teks. Ketika terdapat kumpulan data tekstual yang berjumlah besar, teknik ini akan mencari pola yang menarik untuk melakukan klasifikasi. Beberapa algoritma untuk melakukan text mining dan klasifikasi seperti Naive Bayes dan Rocchio. Penelitian ini menggunakan metode pembobotan kata berdasarkan term frequency. Metode ini sederhana, efisien, dan memiliki tingkat akurasi yang tinggi. Sebelum melakukan klasifikasi, terdapat tiga tahap preprocessing data pada berita dengan cara text processing, tokenizing, dan filtering untuk menyesuaikan data sesuai kebutuhan metode klasifkasi. Evaluasi yang digunakan untuk menguji algoritma adalah confussion matrix yangdidapatkan hasil akurasi sebesar87,22%. Selain itu, nilai presisi yang didadat dari masing-masing kelas sebesar 94,54% pada berita ekonomi, 85% pada berita politik, dan 83,07% pada berita hukum. Sedangkan nilai recall dari masing-masing kelas didapatkan hasil sebesar 86,67% pada berita ekonomi, 85% pada berita politik, dan 90% pada berita hukum.