Peringkasan Literatur Ilmu Komputer Bahasa Indonesia Berbasis Fitur Statistik Dan Linguistik Menggunakan Metode Gaussian Naïve Bayes
Main Author: | Fhadli, Muhammad |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2017
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/147397/1/Muhammad_Fhadli___135150201111004___Skripsi.pdf http://repository.ub.ac.id/147397/ |
Daftar Isi:
- Di tengah era dengan kebutuhan data yang besar ini, peringkasan teks merupakan suatu kebutuhan. Dengan peringkasan teks, setiap orang bisa mendapatkan informasi yang mendeskripsikan keseluruhan data teks yang besar hanya dengan beberapa kalimat. Permasalahan dalam peringkasan teks adalah kualitas hasil ringkasan. Salah satu metode untuk meringkas teks yang dikenal adalah metode TF-IDF, metode ini merupakan metode peringkasan dengan pendekatan statistik. Pendekatan lain untuk meringkas teks adalah pendekatan linguistik. Ringkasan dari sebuah teks terdiri atas kalimat-kalimat yang memiliki fitur-fitur linguistik seperti jumlah kata, jumlah kata kunci, dan posisi kalimat pada teks asli. Fitur-fitur tersebut dapat digunakan untuk mengklasifikasikan suatu kalimat baru kedalam kelas ringkasan atau kelas bukan ringkasan. Hasil peringkasan diperoleh dari kumpulan kalimat pada kelas ringkasan. Pada penelitian ini, penulis melakukan penggabungan fitur statistik dan fitur linguistik untuk melakukan peringkasan teks. Hasil pengujian penelitian ini menunjukkan peringkasan dengan fitur statistik dan linguistik menggunakan metode Naïve Bayes memiliki nilai rata-rata f-score 0,206 dan nilai rata-rata relative utility 0,116.