Klasifikasi Kelas Kata (Part-Of-Speech Tagging) Untuk Bahasa Madura Menggunakan Algoritme Viterbi
Main Authors: | Firmansyah, Ilham, Putra Pandu Adikara, S.Kom., M.Kom., Sigit Adinugroho, S.Kom., M.Sc. |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2020
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/id/eprint/193334/1/0520150393-%20Ilham%20Firmansyah.pdf http://repository.ub.ac.id/id/eprint/193334/ |
Daftar Isi:
- Bahasa manusia adalah bahasa yang digunakan oleh manusia dalam bentuk tulisan maupun suara. Banyak teknologi/aplikasi yang mengolah bahasa manusia, bidang tersebut bernama Natural Language Processing yang merupakan ilmu yang mempelajari untuk mengolah dan mengekstraksi bahasa manusia pada perkembangan teknologi. Salah satu proses pada Natural Language Processing adalah Part-Of-Speech Tagging. Part-Of-Speech Tagging adalah klasifikasi kelas kata pada sebuah kalimat secara otomatis oleh teknologi, proses ini berfungsi untuk mengetahui kata-kata yang memiliki dua makna/arti (Ambiguitas). Part-Of- Speech Tagging merupakan dasar dari Natural Language Processing lainnya, seperti mesin penerjemah (machine translation), pencarian kata ambigu (word sense disambiguation) dan temu kembali informasi (information retrieval). Part- Of-Speech Tagging dilakukan pada bahasa manusia, salah satunya adalah bahasa Madura. Bahasa Madura adalah bahasa daerah yang digunakan oleh suku Madura dan memiliki morofologi yang sama dengan bahasa Indonesia. Penelitian pada Part-Of-Speech Tagging pada bahasa Madura menggunakan algoritme viterbi, terdapat 3 proses untuk implementasi algoritme viterbi pada pada Part-Of-Speech Tagging bahasa Madura, yaitu preprocessing pada data training dan testing, perhitungan data latih dengan Hidden Markov Model dan klasifikasi kelas kata menggunakan algoritme Viterbi. Kelas kata yang digunakan untuk klasifikasi kata pada bahasa Madura sebanyak 19 kelas, kelas kata tersebut dirancang oleh seorang pakar. pengujian sistem pada penelitian ini menggunakan perhitungan Confusion Matrix Multiclass. Hasil pengujian sistem mendapatkan nilai micro average accuracy sebesar 0,96 dan nilai micro average precision dan recall yang sama sebesar 0,68.