PENGARUH PEMBOBOTAN PADA TWEET DI MESIN PENCARI MENGGUNAKAN METODE TF-IDF
Main Author: | FITRIYAH, PUTRI |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2014
|
Subjects: | |
Online Access: |
http://eprints.umm.ac.id/28067/1/jiptummpp-gdl-putrifitri-35291-1-pendahul-n.pdf http://eprints.umm.ac.id/28067/2/jiptummpp-gdl-putrifitri-35291-2-babi.pdf http://eprints.umm.ac.id/28067/ |
Daftar Isi:
- Metode Term Frequency-Inverse Document Frequency (TF-IDF) adalah cara pemberian bobot hubungan suatu kata (term) terhadap dokumen. Metode ini menggabungkan dua konsep untuk perhitungan bobot, yaitu Term Frequency (TF) merupakan frekuensi kemunculan kata (t) pada kalimat (d). document Frequency (DF) adalah banyaknya kalimat dimana suatu kata (t) muncul. Frekuensi kemunculan kata didalam dokumen yang diberikan menunjukkan seberapa penting kata itu di dalam dokumen tersebut. Latar belakang dilakukan penelitian ini adalah banyaknya informasi yang tersedia di internet terutama pada jejaring sosial twitter yang menyimpan beragam informasi dan bervariasi, ada yang bersifat subjective, objective dan campuran. Untuk itu pada penelitian ini saya tertarik untuk mengukur level subjectivitas / objectivitas pada tweets. Selanjutnya saya juga ingin mengetahui pengaruh level ini pada ketepatan mesin pencari. Dalam pemrosesan data di twitter terlebih dahulu dilakukan klasifikasi, preprocessing baru setelah itu dilakukan pembobotan dengan menggunakan metode TF-IDF untuk menentukan level subjectivitas / objectivitas pada tweet. Data yang digunakan sebanyak 500 data tweet dari lima akun berita di twitter yaitu, @kompascom, @Metro_TV, @detikcom, @tvOneNews dan @KontanNews. Pengujian dilakukan terhadap 5 macam kata kunci, Dari hasil pengujian yang telah dievaluasi dengan memperhitungkan nilai recall dan precision menghasilkan nilai recall 1 yang menunjukkan bahwa suatu dokumen yang relevan dapat ditemukan sistem dan nilai precision pada pengindekan berdasarkan level subjectivitas / objectivitas mencapai 90% yang menunjukkan dokumen relevan ditemukan dengan mempertimbangkan level subjectivitas / objectivitas bisa meningkatakan hasil perangkingan pada mesin pencari.