Temu Kembali Informasi Berita Olahraga Berbahasa Indonesia dengan Seleksi Fitur Term Frequency dan Metode BM25

Main Authors: Baihaqi, Rachmad Ridlo, Indriati, S.T., M.Kom., Sutrisno, Ir., M.T.
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2020
Subjects:
Online Access: http://repository.ub.ac.id/id/eprint/194722/1/0520150183%20-Rachmad%20Ridlo%20Baihaqi.pdf
http://repository.ub.ac.id/id/eprint/194722/
Daftar Isi:
  • Bertepatan dengan kemajuan globalisasi era modern sekarang, mengakibatkan meningkatnya pada pemakaian World Wide Web (WWW) dan internet untuk sumber yang menyediakan informasi secara online dari berbagai negara. Sebuah mesin pencari (search engine) dibutuhkan para pengguna internet untuk pencarian informasi. Oleh karena itu, mengakibatkan banyaknya dokumen yang disimpan dalam digital melonjak. Luasnya raihan para pembaca dan waktu yang singkat mengakibatkan munculnya media online dalam menyiarkan berita. Sistem temu kembali informasi (information retrieval) ialah berfungsi memperoleh informasi diinginkan pengguna atau relevan melalui query yang sudah diisi oleh pengguna. Diharapkan implementasi Information retrieval dapat digunakan dalam mendapatkan dokumen sesuai dengan yang dibutuhkan pengguna. Metode BM25 adalah menghitung nilai kemiripan (similarity) kemudian dilakukan proses pemeringkatan dari hasil kemiripan terhadap query. Ditambahkan dengan seleksi fitur term frequency pada saat melakukan training data. Pengujian dilakukan berdasarkan nilai precision @k dan nilai kappa measure terhadap 10 query. Didapatkan nilai terbaik pada pengujian precision @k adalah saat k=5, dengan nilai 90% dan 86%. Untuk nilai yang didapatkan dari pengujian kappa mesure sebesar 0,85.