Sistem Peringkas Dokumen Otomatis Pada Teks Berbahasa Indonesia Dengan Algoritma ClusterRank
Main Author: | Febryan |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2011
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/152846/1/051105405.pdf http://repository.ub.ac.id/152846/ |
Daftar Isi:
- Peringkasan teks otomatis (automatic text summarization) adalah pembuatan versi yang lebih singkat dari sebuah teks dengan memanfaatkan aplikasi pada komputer. Proses sistem peringkasan dokumen teks otomatis berbahasa indonesia menggunakan algoritma ClusterRank yaitu penggabungan antara metode clustering dengan group average HAC, dan metode perangkingan graf dengan Lexrank. Pada penelitian ini digunakan sebanyak 10 dokumen teks berbahasa indonesia dengan sebagai dokumen uji. Pengujian dokumen dilakukan dengan memberikan dua nilai threshold yaitu threshold ukuran ringkasan dan threshold jumlah cluster. Threshold ukuran ringkasan diantaranya 25%, 50%, dan 75% dari ukuran asli dokumen. Threshold jumlah cluster diantaranya 4, 6, 8, 10, dan 12 cluster. Akurasi yang dihasilkan sistem ditunjukkan dengan nilai rata – rata keseluruhan dari precision dan recall mencapai 0,412 dan 0,520. Nilai precision tertinggi dihasilkan pada threshold ringkasan = 25% dan threshold cluster = 6 yaitu dengan precision = 0,472. Untuk nilai recall tertinggi dihasilkan pada threshold ringkasan = 75% dan threshold cluster = 12 yaitu dengan precision = 0,554. Nilai precision dan recall bergantung pada kesesuain hasil ringkasan sistem dengan hasil ringkasan manusia. Pada penelitian ini, dokumen dengan kode dokumen 4 menghasilkan nilai precision paling tinggi yaitu dengan precision = 0,833 pada threshold ringkasan 25% dan threshold cluster 6 dan 8. Hal ini menunjukkan bahwa kalimat penting yang diekstrak sistem pada dokumen 4 hampir sesuai dengan hasil ringkasan manusia.