Aplikasi Rules-Based Part-Of-Speech-Tagging dan Named Entity Recognition untuk Bahasa Indonesia
Format: | Bachelors |
---|---|
Terbitan: |
#CREATOR_ORGNAME#
, 2019
|
Subjects: | |
Online Access: |
http://digilib.polban.ac.id\/download.php?id=29593 |
Daftar Isi:
- Tugas Akhir ini berkaitan dengan pengembangan aplikasi komputer untuk penandaan kelas kata pada suatu satuan gramatika untuk Bahasa Indonesia. Hasil yang diharapkan dari Tugas Akhir ini adalah suatu aplikasi komputer yang dapat secara otomatis menandai kelas kata pada suatu kalimat, yang selanjutnya diperlukan untuk melakukan pengolahan bahasa alami yang lebih lanjut. Part-of-speech tagging adalah kegiatan menandai sebuah satuan gramatika dengan kelas katanya. Penandaan kelas kata ini memberikan wawasan linguistik bagaimana suatu satuan gramatika digunakan dalam suatu cakupan konteks. Proses yang fundamental dalam hampir semua aplikasi pengolahan bahasa alami tingkat lanjut ini sangat perlu untuk diotomasi, terlebih dengan banyaknya data yang diproses. Aplikasi yang sudah ada, memiliki kemampuan untuk menandai satuan gramatika pada level kata dengan memanfaatkan aturan morfologi kata dan juga aturan disambiguasi untuk kata yang memiliki kelas kata lebih dari satu. Namun, aplikasi yang sudah ada ini belum dapat menandai kata yang berupa kata dalam bahasa asing. Aplikasi ini juga belum dapat mengelompokkan satuan gramatika yang lebih tinggi dari kata dan melakukan pengelompokkan kata benda khusus. Sehingga, pengolahan bahasa alami tingkat lanjut yang membutuhkan informasi tersebut tidak bisa dilakukan. Pendekatan yang dilakukan pada Tugas Akhir untuk mengatasi masalah di atas adalah dengan cara menyempurnakan aplikasi yang sudah ada dengan menggunakan metode aturan. Digunakan aturan fraseologi sebagai acuan pengelompokkan frasa dan proses named entity recognition untuk menandai kata benda khusus. Digunakan juga korpus kata dalam Bahasa Inggris sebagai acuan penandaan kata dalam Bahasa Inggris dan korpus prefiks sebagai penunjang proses named entity recognition. Hasil dari Tugas Akhir adalah aplikasi part-of-speech tagger untuk Bahasa Indonesia yang telah dapat menandai kata Bahasa Inggris ke dalam kelompok bahasa asing. Kemampuan lain bisa dilakukan adalah mengelompokkan dan menandai frasa serta menandai kata benda khusus yang menunjukkan orang, lokasi dan organisasi. Implikasi dari aplikasi yang dibuat ini memberi nilai lebih dari aplikasi yang sudah ada sebelumnya. Namun demikian kata bahasa asing yang dapat ditandai hanya kata dasar dalam Bahasa Inggris dan pengelompokkan frasa tunggal. Penandaan kata benda khusus yang menunjukkan nama orang belum dapat dilakukan. Pengembangan lebih lanjut dapat dilakukan dengan menambah korpus bahasa asing dan aturan frasa untuk jenis-jenis lainnya. Selain itu diperlukan metode lain untuk menyelesaikan penandaan kata benda khusus yang merupakan nama orang. Kata kunci: part-of-speech tagging, metode aturan, fraseologi, named entity recognition.