Pemanfaatan Vector Space Model pada Penerapan Algoritma Nazief Adriani, KNN dan Fungsi Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks Bahasa Indonesia

Main Authors: Susandi, Diki, Sholahudin, Usep
Format: Article info application/pdf Journal
Bahasa: eng
Terbitan: Universitas Serang Raya , 2017
Online Access: http://e-jurnal.lppmunsera.org/index.php/ProTekInfo/article/view/54
http://e-jurnal.lppmunsera.org/index.php/ProTekInfo/article/view/54/50
Daftar Isi:
  • Vector space model (VSM) adalah suatu model yang digunakan untuk mengukur kemiripan antara suatu dokumen dengan suatu query. Pada model ini, query dan dokumen dianggap sebagai vektor-vektor pada ruang n-dimensi, dimana n adalah jumlah dari seluruh term yang ada di dalam daftar. Teknologi informasi khususnya internet sangat mendukung terjadinya pertukaran informasi dengan sangat cepat. Kondisi tersebut memunculkan masalah untuk mengakses informasi yang diinginkan secara akurat dan cepat. Untuk mengatasi masalah tersebut, salah satu teknik yang dapat digunakan adalah dengan mengklasifikasikan teks dokumen tersebut sesuai dengan karakteristik, fitur, maupun kelasnya berdasarkan aturan baku bahasa yang akan diolah. Dalam penelitian ini Bahasa Indonesia adalah bahasa yang digunakan sebagai sumber acuan. Jenis penelitian ini termasuk kepada penelitian terapan (Applied Research). Objek dalam penelitian ini adalah dokumen Teks Berbahasa Indonesia. Tujuan dari penelitian ini menganalisis efektifitas model sistem klasifikasi / kategorisasi dokumen dalam penerapan vector space model berdasarkan pembobotan term dokumen dan query, juga menerapkan metode stemming Bahasa Indonesia dengan algoritma nazief adriani, menghasilkan nilai similarity dengan fungsi cosine yang berpengaruh pada pemeringkatan hasil kategorisasi dokumen yang relevan.