Identifikasi Kemiripan Teks Menggunakan Class Based Indexing Dan Cosine Similarity Untuk Klasifikasi Dokumen Pengaduan
Main Author: | Iriananda, Syahroni Wahyu |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2018
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/id/eprint/190836/1/SYAHRONI%20WAHYU%20IRIANANDA%20%282%29.pdf http://repository.ub.ac.id/id/eprint/190836/ |
Daftar Isi:
- Dewasa ini masyarakat dapat secara mudah berinteraksi dan berkomunikasi dua arah dengan lembaga pemerintahan melalui pemanfaatan teknologi informasi yaitu Sistem Layanan Aspirasi dan Pengaduan Online Rakyat. Penanganan laporan bergantung pada beberapa administrator sistem yang secara manual menganalisis laporan dengan membaca setiap laporan yang masuk. Permasalahan yang ditemukan adalah penentuan kategori pada laporan pengaduan melalui kanal pesan singkat (SMS) tersebut masih dilakukan secara manual. Model pelaporan melalui kanal ini belum menggunakan format khusus, dimana isi laporan dapat memuat informasi kategori, lembaga tujuan, identitas dan nama pengirim, area kerja lembaga dan jumlah karakter dari kanal tersebut yang terbatas. Maka dari itu diperlukan suatu solusi supaya penentuan kategori pada laporan dapat dilakukan secara otomatis dan sistematis Dalam penelitian ini mengusulkan suatu model atau pendekatan yang dapat mengukur dan mengidentifikasi kemiripan dokumen laporan yang dilakukan secara terkomputerisasi yang dapat mengidentifikasi kemiripan antara dokumen laporan baru dengan dokumen yang telah selesai ditangani. Dalam penelitian ini digunakan metode pembobotan kata berbasis kelas (Class-Based Indexing), dan Cosine Similarity untuk menganalisa kemiripan dokumen. Nilai fitur Cosine Similarity berbasis kelas kemudian ditetapkan sebagai set fitur untuk proses klasifikasi teks menggunakan metode K-Nearest Neighbor (K-NN). Berdasarkan hasil pengujian yang telah dilakukan ditemukan bahwa hasil akurasi maksimal yaitu 84%, menggunakan rasio data latih 75% dan data uji 25% nilai Nilai k = 5 memiliki tingkat akurasi yang tinggi yaitu 84,12%