Ekstraksi Kata Kunci Otomatis untuk Dokumen Berbahasa Indonesia menggunakan metode Genitor-plus-Extractor (GenEx)

Main Authors: Satiabudhi, Gregorius, Noertjahyana, Agustinus, SUSILO, RISKY YUNIARTO
Format: Proceeding PeerReviewed application/pdf
Terbitan: , 2012
Subjects:
Online Access: https://repository.petra.ac.id/16019/1/Publikasi1_02030_713.pdf
http://senastik.trunojoyo.ac.id/
https://repository.petra.ac.id/16019/
Daftar Isi:
  • Ekstraksi Kata Kunci Otomatis adalah sebuah aplikasi yang digunakan untuk menghasilkan sebuah daftar keyphrase / kata kunci secara otomatis. Algoritma utama yang digunakan adalah algortima GenEx yang dibuat oleh Turney, dengan beberapa penyesuaian karena digunakan untuk ekstraksi keyphrase dari artikel berbahasa Indonesia. Penyesuaian dilakukan pada proses stemming pada bagian Extractor dengan menggantinya mengunakan algoritma Porter Stemmer for Bahasa Indonesia yang dibuat oleh Tala. Penyesuaian perlu dilakukan karena kata dalam bahasa Indonesia memiliki tiga macam imbuhan (prefiks, infiks dan suffiks) sementara kata dalam bahasa Inggris hanya memiliki imbuhan dibelakang (suffiks). GenEx adalah algoritma yang memanfaatkan Algortima Genetika (Genitor) untuk membentuk sekelompok parameter yang digunakan saat mengekstrak kata kunci dari sebuah artikel didalam proses Extractor. Hasil pengujian nilai recall dari keyphrase yang di-generate terhadap kata kunci dari author bernilai rata - rata 60. Sementara hasil pengujian oleh responden menunjukkan bahwa 95 responden menyatakan bila keyphrase yang di-generate dapat mewakili artikelnya. Kedua hasil menunjukkan bahwa aplikasi ini telah berhasil menggenerate kata kunci (keyphrase) yang sesuai dan dapat mewakili artikel yang diproses.