PEMBUATAN MODEL NAMED ENTITY RECOGNITION UNTUK TWITTER BAHASA INDONESIA DENGAN MENGGUNAKAN STANFORD NER
Main Author: | Saniy, MarÂ’ie |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2016
|
Subjects: | |
Online Access: |
http://eprints.umm.ac.id/34231/1/jiptummpp-gdl-mariesaniy-44849-2-babi.pdf http://eprints.umm.ac.id/34231/2/jiptummpp-gdl-mariesaniy-44849-1-1.penda-n.pdf http://eprints.umm.ac.id/34231/ |
Daftar Isi:
- Twitter adalah salah satu jejaring sosial dalam bentuk microblog yang populer dan memiliki banyak pengguna di Indonesia. Kiriman tweet pengguna di Indonesia memiliki pola bahasa yang terbagi ke dalam dua jenis, yaitu bahasa formal dan bahasa informal. Seiring berkembangnya layanan microblog seperti Twitter, named-entity pada suatu kalimat bahasa Indonesia baik formal maupun informal juga berkembang. Dari berbagai macam named-entity pada bahasa Indonesia, penulis tertarik untuk mengidentifikasi ¬¬¬¬¬named-entity pada data tweet dengan menggunakan Named Entity Recognition (NER). NER adalah salah satu komponen utama dari information extraction yang bertujuan untuk mendeteksi dan mengklasifikasikan named-entity pada suatu teks. Dalam hal ini, NER yang digunakan adalah Stanford NER. Stanford NER dapat mengenali named-entity pada tweet bahasa Indonesia baik formal maupun informal cukup baik, dengan nilai recall dan presisi untuk model bahasa Indonesia formal yaitu 62% dan 87%, untuk model bahasa Indonesia informal yaitu 36% dan 90%, serta untuk model umum yaitu 60% dan 86%. Pengujian Cross Validation didapatkan hasil nilai recall dan presisi yaitu 69% dan 87%. Pengujian model umum dan Cross Validation membuktikan bahwa tanpa pengelompokan data untuk membuat model tweet bahasa Indonesia didapatkan hasil yang cukup.