Klasifikasi Dokumen Teks Menggunakan Metode Improved K-Nearest Neighbor (Knn) Berdasarkan Emosi Yang Tersirat Pada Teks
Main Author: | Hamid,MAchyar |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2012
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/152954/1/051200087.pdf http://repository.ub.ac.id/152954/ |
Daftar Isi:
- Klasifikasi dokumen teks berdasar emosi ini digunakan untuk mengklasifikasikan dokumen teks berdasarkan kata-kata emosi yang tersirat didalamnya. Dari masing-masing kata tidak diperhatikan hubungan antar katanya. Proses diawali dengan preprocessing kemudian dibentuk inverted index. Pembobotan menggunakan TF-IDF dan pencarian kemiripan digunakan cosine similarity. Proses klasifikasi menggunakan metode improved K-Nearest Neighbor (KNN). Penelitian ini menggunakan data latih sebanyak 200 kalimat untuk masing-masing emosi, emosi tersebut antara lain marah, sedih, takut, jijik, malu, senang dan bersalah. Data uji menggunakan 70 kalimat yang telah diberikan label emosi. Nilai k digunakan rentang dari 1 sampai dengan 70. Sistem akan menentukan relevansi berdasarkan kecocokan tabel antara data latih dan data uji. Sistem bekerja menghasilkan tingkat akurasi sebesar 0.5-0.7 dengan menggunakan fmeasure sebagai parameter evaluasi . Nilai fmeasure terbesar dihasilkan pada k= 13 yaitu sebesar 0.7. Dari nilai fmeasure yang dihasilkan sistem belum bekerja dengan baik karena masih belum mendekati nilai 1 yang merupakan nilai maksimal dari akurasi sistem temu kembali.