Peringkasan Teks Otomatis Secara Ekstraktif Pada Artikel Berita Kesehatan Berbahasa Indonesia Dengan Menggunakan Metode Latent Semantic Analysis
Main Author: | Gotami, Nurina Savanti Widya |
---|---|
Format: | Thesis NonPeerReviewed |
Terbitan: |
, 2018
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/11634/ |
Daftar Isi:
- Meningkatnya jumlah data digital dengan cepat setiap tahunnya, seperti data teks dokumen yang dapat berupa teks artikel berita ini membuat sulit untuk membaca seluruh informasi yang ada. Banyaknya informasi online yang tersedia pada penyedia informasi online yang mempengaruhi hasil informasi yang diperoleh relatif sulit serta waktu yang lebih lama untuk mengekstrasi suatu informasi pada sebuah dokumen. Oleh karena itu, perlu adanya peringkasan teks otomatis secara ekstraktif pada artikel kesehatan berbahasa Indonesia dengan tujuan membantu pembaca atau pengguna untuk mempermudah dalam proses ekstraksi data atau informasi yang ada pada dokumen dengan waktu yang cepat serta efisien serta dapat menghasilkan informasi penting yang ringkas serta jelas. Pada penelitian ini menggunakan metode latent semantic analysis (LSA) merupakan sebuah metode yang mengekstrak struktur semantik atau makna yang tersembunyi pada sebuah kalimat dan menghasilkan ringkasan yang bermakna umum atau luas. Metode LSA menggunakan pendekatan aljabar linear singular value decomposition (SVD) dengan membentuk matriks representasi dari asosiasi term yang merupakan kata-kata pada dokumen yang berhubungan erat. Cross LSA digunakan untuk menyusun urutan ringkasan dalam tahap ekstraksi ringkasan. Pengujian penelitian ini menghasilkan bahwa hasil peringkasan teks dengan metode LSA memperoleh nilai rata-rata akurasi precision, recall dan f-measure secara berurutan pada compression rate 50% dengan nilai 0.668, 0.743, 0.700 dan 0.690 sedangkan pada compression rate 40% sebesar 0.696, 0.605, 0.642 dan 0.663.