Peringkasan Multi Dokumen Berbahasa Inggris Berbasis Konten Menggunakan Single Pass Clustering Dan Perangkingan Berbasis Algoritma Genetika

Main Author: Arintadewi,Tiara
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2012
Subjects:
Online Access: http://repository.ub.ac.id/153328/1/051200645.pdf
http://repository.ub.ac.id/153328/
Daftar Isi:
  • Saat ini perolehan informasi dan pertukaran data berupa teks melibatkan banyak sumber informasi. Tidak terbatasnya informasi digital ini memerlukan suatu cara yang mudah untuk mengetahui informasi dari dokumen, salah satunya dengan peringkasan dokumen. Metode peringkasan dokumen semula ditujukan untuk membuat ringkasan dari dokumen tunggal, namun sekarang menjadi metode yang menghasilkan ringkasan dari multi dokumen sehingga pengguna dapat memahami teks dari banyak sumber dengan mudah. Berbagai macam dokumen masukan tidak dapat diringkas menjadi satu, hanya dokumen-dokumen yang memiliki kesamaan konten yang dapat menghasilkan satu ringkasan. Untuk itu sebelum diringkas, dokumen-dokumen tersebut dikelompokkan terlebih dahulu menggunakan Single Pass Clustering . Peringkasan dilakukan untuk tiap dokumen dengan ekstraksi kalimat dan perangkingan berbasis algoritma genetika. Hasil dari ringksan tiap dokumen dalam satu cluster digabung menjadi satu ringkasan. Ekstraksi kalimat berfungsi untuk mengidentifikasi kalimat-kalimat penting berdasarkan fitur-fitur yang ditentukan dan dari nilai fitur-fitur tersebut kalimat akan dirangking secara optimal dengan algoritma genetika. Penelitian ini diujikan pada beberapa cluster dokumen dengan ukuran ringkasan 25%, 50%, dan 75%. Berdasarkan pengujian yang dilakukan dihasilkan rata-rata precision 0.710491, rata-rata recall 0.70388, dan rata-rata F-measure 0.7069. Nilai F-measure merepresentasikan akurasi sistem. Dengan tingkat akurasi yang dihasilkan maka metode ini cukup membantu dalam memperoleh infomasi dengan efisien.