Daftar Isi:
  • SCAM adalah singkatan dari Stanford Copy Analysis Mechanism dimana menjadi biasanya tolak ukur relatif untuk mendeteksi overlapping dengan membuat perbandingan pada satu set kata-kata yang umum antara dokumen tes dan dokumen terdaftar. Vector Space Model sebuah model populer dalam domain IR, adalah model VSNI. Mengingat permintaan dengan bobot yang sesuai, produk dot terjadinya vektor tertimbang dari query dengan dokumen yang disimpan dan dihitung: jika nilai produk dot melebihi batas tertentu, dokumen ditandai untuk mencocokkan query. Sistem ini mampu melakukan mengukuran kemiripan dokumen Bahasa Indonesia. Dokumen yang digunakan berupa file import dokumen dan input text jadi user dapat memilih input data dengan.