Analisis Penggunaan Metode Weighted PageRank Dengan Latent Semantic Analysis Pada Sistem Temu Balik Informasi
Format: | Bachelors |
---|---|
Terbitan: |
#CREATOR_ORGNAME#
, 2017
|
Subjects: |
Daftar Isi:
- Sistem temu balik informasi adalah sistem yang dapat memberikan hasil pencarian kepada pengguna berdasarkan kata kunci yang dimasukkannya. Kekurangan yang paling mendasar pada metode pencarian saat ini adalah kata kunci yang digunakan dalam pencarian seringkali menghasilkan hanya informasi yang mengandung sintaks yang sama dengan kata kunci, sehingga kadang tidak sesuai dengan informasi yang mereka cari. Masalah yang dibahas dalam penelitian ini yaitu pengembangan sistem temu balik informasi yang menghasilkan pencarian yang relevan tetapi tidak hanya berdasarkan sintaks tetapi juga semantic dan berdasarkan popularitas. Untuk pengambilan informasi, hasil dari pencarian informasi berupa daftar halaman web yang sudah difilter berdasarkan term query yang diinputkan. Perangkat lunak ini melakukan pembacaan terhadap halaman web dengan menggunakan HTML DOM yang kemudian menjadi beberapa string dari halaman web tersebut dan dilakukan proses tokenizing dan filtering yang menghasilkan token-token yang terpilih dan dilanjutkan dengan stemming dimana mekanismenya diambil dari salah satu algoritma stemming kata yaitu algoritma Porter. Pada saat proses ekstraksi akan didapatkan juga outlink dan inlink dari anchor tag dari suatu halaman web sebagai nilai awal untuk pembobotan menggunakan Weighted PageRank (WPR). Setelah itu dihitung bobot term menggunakan Term Frequency-Inverse Document Frequency (TF-IDF) dan dihitung tingkat kemiripan (similaritas) menggunakan metode Latent Semantic Analysis (LSA). Hasil dari penelitian ini menunjukan bahwa penggabungan metode Latent Semantic Analysis (LSA) dengan Weighted PageRank (WPR) dalam sistem temu balik informasi dapat meningkatkan relevansi data yang dihasilkan sebesar 15%, dibandingkan dengan sistem temu balik informasi yang hanya menggunakan metode Weighted PageRank (WPR). Kata Kunci: TF-IDF, LSA, SVD, WPR, sistem temu balik informasi, similarity, filtering, outlink, inlink.