PERINGKASAN TEKS OTOMATIS BERITA BERBAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE

Main Authors: Mustaqhfiri, Muchammad, Abidin, Zainal, Kusumawati, Ririen
Format: Article info application/pdf eJournal
Bahasa: eng
Terbitan: Department of Informatics Engineering , 2012
Subjects:
Online Access: http://ejournal.uin-malang.ac.id/index.php/saintek/article/view/1578
http://ejournal.uin-malang.ac.id/index.php/saintek/article/view/1578/2774
http://ejournal.uin-malang.ac.id/index.php/saintek/article/view/1578/2775
Daftar Isi:
  • Perkembangan teknologi internet berdampak bertambahnya jumlah situs berita berbahasa Indonesia dan menciptakan ledakan informasi. Hal tersebut menuntut semua informasi bisa diakses dengan cepat dan tidak harus membutuhkan banyak waktu dalam membaca sebuah headline berita.Teknologi peringkas teks otomatis menawarkan solusi untuk membantu pencarian isi berita berupa deskripsi singkat (summary). Penelitian dia­wali dengan lima tahap text preprocessing: pemecahan kalimat,case folding, tokenizing, filtering, dan stemming. Proses selanjutnya menghitung bobot tf-idf, bobot query relevance dan bobot similarity. Ringkasan dihasilkan dari ekstraksi kalimat dengan menggunakan metode maximum marginal relevance. Metode ekstraksi maximum marginal relevance me­rupakan metode yang digunakan untuk mengurangi redudansi dalam perangkingan kali­mat pada multi dokumen. Data uji coba diambil dari surat kabar berbahasa Indonesia on-line sejumlah 30 berita. Hasil pengujian dibandingkan dengan ringkasan manual yang menghasilkan rata-rata recall 60%, precision 77%, dan f-measure 66%. Kata kunci: peringkasan, text preprocessing, tf-idf, query relevance, similarity, maximum marginal relevance