NAMED ENTITY RECOGNITION TWEET BAHASA INDONESIA MENGGUNAKAN STANFORD NER, STANFORD POS TAGGER DAN RANDOM FOREST
Main Author: | Zulvikar, Yudhawan Agam |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2017
|
Subjects: | |
Online Access: |
http://eprints.umm.ac.id/36101/1/jiptummpp-gdl-yudhawanag-49130-1-pendahul-n.pdf http://eprints.umm.ac.id/36101/2/jiptummpp-gdl-yudhawanag-49130-2-babi.pdf http://eprints.umm.ac.id/36101/3/jiptummpp-gdl-yudhawanag-49130-3-babii.pdf http://eprints.umm.ac.id/36101/4/jiptummpp-gdl-yudhawanag-49130-4-babiii.pdf http://eprints.umm.ac.id/36101/ |
Daftar Isi:
- Named Entity Recognition adalah salah satu komponen utama dari information extration yang bertujuan untuk mendeteksi dan mengklasifikasikan named-entity di sebuah teks. Named Entity Recognition umumnya digunakan untuk mendeteksi nama orang, nama tempat dan organisasi dari sebuah dokumen, tetapi dapat juga diperluas suntuk identifikasi gen, protein dan lainnya sesuai kebutuhan. Secara umum algoritma NER yang ada telah mampu melakukan proses klasifikasi dengan hasil yang cukup memuaskan, dengan syarat model yang digunakan dibangun berdasarkan domain klasifikasi. Oleh karena itu, implementasi pada data twitter Bahasa Indonesia didahului dengan pembangunan model berdasarkan korpus twitter Bahasa Indonesia juga. Selanjutnya untuk memperbaiki kinerja Stanford NER bisa dimanfaatkan proses Pos Tagging dan kemudian di klasifikasikan menggunakan algoritma random forest. Dalam penelitian ini, hasil klasifikasi dengan menggunakan random forest berhasil menaikkan nilai precision dan recall hingga 99%.