ANALISA PERBANDINGAN KINERJA NER STANFORD DENGAN OPENNLP UNTUK TWITTER BAHASA INDONESIA
Main Author: | Mardhika, Wiedha Agust Ike |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2017
|
Subjects: | |
Online Access: |
http://eprints.umm.ac.id/36122/1/jiptummpp-gdl-wiedhaagus-48440-1-pendahul-n.pdf http://eprints.umm.ac.id/36122/2/jiptummpp-gdl-wiedhaagus-48440-2-babi.pdf http://eprints.umm.ac.id/36122/3/jiptummpp-gdl-wiedhaagus-48440-3-babii.pdf http://eprints.umm.ac.id/36122/4/jiptummpp-gdl-wiedhaagus-48440-4-babiii.pdf http://eprints.umm.ac.id/36122/ |
Daftar Isi:
- Banyak informasi yang bisa didapat dari Twitter, mulai dari informasi umum sampai khusus. Banyak cara untuk mengolah data Twitter, salah satunya adalah menggunakan identifikasi entitas NER (Named Entity Recognizer), adalah sebuah urutan kata dalam teks yang mengklasifikasikan nama-nama benda, orang dan nama perusahaan, dan nama gen atau protein. Dari uraian di atas, penelitian yang akan diangkat adalah untuk mengetahui NER manakah yang memiliki tingkat efektifitas yang lebih baik untuk digunakan pada Twitter berbahasa Indonesia, antara NER Stanford atau OpenNLP. Hasil penelitian membuktikan bahwa dengan model Tweet bahasa Indonesia formal, NER Stanford memiliki nilai lebih tinggi daripada OpenNLP NER dengan hasil recall, 33% : 24%, presisi, 58% : 74%, dan F-Measure, 53% : 37%, dan dengan menggunakan data model Tweet bahasa Indonesia Non-Formal didapatkan hasil yang sama, recall, 68% : 31%, presisi, 91% : 79%, dan F-Mesure, 68% : 44%.