Named Entity Recognition Untuk Teks Bahasa Indonesia Menggunakan Support Vector Machine

Main Author: Ramadhani, Iqbal
Format: Thesis NonPeerReviewed Book eArticle
Bahasa: eng
Terbitan: , 2020
Subjects:
Online Access: http://elibrary.unikom.ac.id/id/eprint/2683/1/1.%2010115025_IQBAL%20RAMADHANI_COVER.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/2/19.%2010115025_IQBAL%20RAMADHANI_LEMBAR%20PENGESAHAN.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/3/17.%2010115025_IQBAL%20RAMADHANI_SURAT%20KETERANGAN%20PUBLIKASI.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/4/20.%2010115025_IQBAL%20RAMADHANI_SURAT%20KETERANGAN%20ORISINALITAS.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/5/4.%2010115025_IQBAL%20RAMADHANI_KATA%20PENGANTAR.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/6/5.%2010115025_IQBAL%20RAMADHANI_DAFTAR%20ISI.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/7/11.%2010115025_IQBAL%20RAMADHANI_BAB%201.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/8/12.%2010115025_IQBAL%20RAMADHANI_BAB%202.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/9/13.%2010115025_IQBAL%20RAMADHANI_BAB%203.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/10/14.%2010115025_IQBAL%20RAMADHANI_BAB%204.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/11/15.%2010115025_IQBAL%20RAMADHANI_BAB%205.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/12/10.%2010115025_IQBAL%20RAMADHANI_DAFTAR%20PUSTAKA.pdf
http://elibrary.unikom.ac.id/id/eprint/2683/
https://elibrary.unikom.ac.id
Daftar Isi:
  • Pengenalan entitas bernama atau Named Entity Recognition (NER) merupakan sebuah topik keilmuan yang membahas pemrosesan bahasa alami dengan mengekstraksi informasi pada sebuah teks. NER juga merupakan komponen penting yang mendasari banyak aplikasi Natural Language Processing (NLP). Penelitian tentang NER sudah pernah dilakukan menggunakan beberapa metode seperti CRF, Naive Bayes, dan SVM. Penelitian NER pada metode SVM menghasilkan nilai performa f1-score sebesar 50% yang disebabkan karena hasil dari ekstraksi fitur yang digunakan. Sebelum tahap pelatihan dan pengujian dilakukan, list kata melalui tahap preprocessing, yaitu pemisahan kata dan label, case folding, pembentukan kamus, one hot encoding, ekstraksi fitur, kemudian penggabungan hasil one hot encoding dengan hasil ekstraksi fitur. Berdasarkan hasil pengujian yang telah dilakukan pada 9405 list kata, didapatkan nilai akurasi tertinggi sebesar 81% dengan recall sebesar 70%, precession 52%, dan f1-score sebesar 53%. Tingkat akurasi ini dipengaruhi oleh penggunaan metode one hot encoding yang tidak bisa membedakan ciri untuk data yang sama pada kelas yang berbeda.