PERINGKASAN TEKS OTOMATIS PADA DOKUMEN BERITA BERBAHASA INDONESIA DENGAN METODE MAXIMUM MARGINAL RELEVANCE DENGAN IMPROVED SQRT-COSINE SIMILARITY
Main Author: | Aryo Wicaksono, Kevin |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2021
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/184452/1/Kevin%20Aryo%20Wicaksono.pdf http://repository.ub.ac.id/184452/ |
Daftar Isi:
- Peringkasan teks otomatis pada dasarnya merupakan proses menyederhanakan suatu teks dengan cara membuat ringkasan yang mewakilkan isi dari teks tersebut. Sumber informasi utama tentang kejadian yang sudah terjadi atau sedang terjadi adalah berita, berita seringkali diharapkan dengan isi yang terlalu panjang sehingga tidak efektif bagi pembacanya. Hal tersebut menyebabkan kurang efisiennya waktu yang diperlukan untuk mendapatkan informasi dari suatu teks berita, sehingga diperlukan adanya ringkasan yang mewakili isi dari teks berita tersebut dalam bentuk yang lebih sederhana sehingga lebih mudah dan cepat dipahami. Penelitian ini diawali dengan melakukan preprocessing pada teks berita yang akan diringkas. Proses selanjutnya adalah mencari bobot masing-masing token dengan metode pembobotan TFIDF, dengan memanfaatkan nilai TFIDF maka dapat dicari similarity antar kalimat dengan metode ISC Similarity. Ringkasan dibuat berdasarkan nilai MMR dari masing-masing kalimat mulai dari yang tertinggi, nilai MMR yang tinggi menandakan bahwa kalimat tersebut mirip dengan query yang digunakan. Query dalam pembuatan ringkasan didapatkan dari judul berita yang diuji. Hasil pengujian ringkasan oleh sistem dengan metode ROUGE-L mendapatkan nilai rata-rata tertinggi pada ringkasan dengan persentase 10% dengan nilai rata-rata precision 0,8743, recall 0,7678, dan f-measure 0,7678.