Pengindeksan Menggunakan Maximal Frequent Sequences Untuk Sistem Temu-Kembali Informasi Dalam Teks Berbahasa Indonesia
Main Author: | Aprijani, Dwi Astuti |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2006
|
Subjects: | |
Online Access: |
http://repository.ut.ac.id/2694/1/41191.pdf http://repository.ut.ac.id/2694/ |
Daftar Isi:
- Penelitian ini mengkaji penggunaan Maximal Frequent Sequences (MFS) sebagai indeks dalam koleksi dokumen untuk Sistem Temu-kembali lnformasi (STI). Indeks, sebagai representasi dokumen, harus menggambarkan informasi keseluruhan yang terkandung dalam dokumen. MFS sebagai salah satu cara untuk mengekspresikan multi kata (frase) dapat digunakan sebagai indeks dalam koleksi doknmen untuk merepresentasikan isi dokumen. Bahkan MFS yang panjang dapat memberikan ringkasan yang tepat dari isi dokumen. Kekuatan utama MFS dapat membentuk indeks yang sangat solid karena menoleransi adanya kata-kata pemisah di antara suatu pasangan kata. Hasil uji coba terhadap 3000 dokumen berita dan 1162 dokumen ilmiah menunjukkan bahwa MFS memberikan representasi dokumen yang baik. Proses stemming mereduksi kata unik sebesar 24 % pada dokumen berita dan 18 % pada dokumen ilmiah, sehingga MFS yang dihasilkan tidak banyak berbeda.