Implementasi Representasi Kata Tingkat Karakter Menggunakan Embedding from Language Models (ELMo) pada Pengurai Dependensi Bahasa Indonesia

Main Author: Anthony, Anthony
Format: Thesis NonPeerReviewed application/pdf
Bahasa: eng
Terbitan: , 2020
Subjects:
Online Access: http://kc.umn.ac.id/13262/1/HALAMAN_AWAL.pdf
http://kc.umn.ac.id/13262/2/DAFTAR_PUSTAKA.pdf
http://kc.umn.ac.id/13262/3/BAB_I.pdf
http://kc.umn.ac.id/13262/4/BAB_II.pdf
http://kc.umn.ac.id/13262/5/BAB_III.pdf
http://kc.umn.ac.id/13262/6/BAB_IV.pdf
http://kc.umn.ac.id/13262/7/BAB_V.pdf
http://kc.umn.ac.id/13262/8/LAMPIRAN.pdf
http://kc.umn.ac.id/13262/
ctrlnum 13262
fullrecord <?xml version="1.0"?> <dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><relation>http://kc.umn.ac.id/13262/</relation><title>Implementasi Representasi Kata Tingkat Karakter Menggunakan Embedding from Language Models (ELMo) pada Pengurai Dependensi Bahasa Indonesia</title><creator>Anthony, Anthony</creator><subject>T58.5-58.64 Information technology</subject><description>Tujuan dilakukannya penguraian dependensi adalah untuk mengetahui hubungan fungsional yang terjadi di antara kata, seperti misalnya hubungan subjek-objek di dalam kalimat. Untuk menguraikan kalimat bahasa Indonesia, morfologi kata perlu diketahui. Hal ini dikarenakan tata bahasa Indonesia banyak sekali melakukan pengimbuhan kata. Berdasarkan hal tersebut, informasi tentang morfologi seharusnya ikut disertakan. Beruntungnya, informasi tersebut bisa disertakan secara implisit oleh representasi kata. Misalnya, Embeddings from Language Models (ELMo) yang berkemampuan untuk menyimpan morfologis kata di dalam representasi kata miliknya. Tidak seperti representasi kata yang secara luas digunakan seperti word2vec ataupun Global Vectors (GloVe), ELMo mempergunakan metode yang berbeda yaitu Character Convolutional Neural Network (Char CNN). Metode ini ditujukan agar pengimbuhan kata bisa tersertakan di dalam representasi kata. Untuk membandingkan ELMo dengan word2vec, beberapa analisis dilakukan yang antara lain analisis kemiripan kata dan pengvisualisasian kata. Hasil analisis menunjukan bahwa representasi kata ELMo lebih baik dibanding word2vec dalam hal menyimpan morfologis kata. Kemudian, pengurai coba dilatih menggunakan representasi kata milik word2vec dan ELMo. Sesuai dugaan, pengurai yang menggunakan ELMo mendapatkan akurasi yang lebih baik dibandingkan dengan word2vec. Unlabeled Attachment Score (UAS) yang didapatkan oleh ELMo adalah sebesar 83.55% sedangkan word2vec 81.35%. Oleh sebab itu penelitian ini mengkonfirmasikan bahwa morfologis kata wajib diikutsertakan terutama pada tugas penguraian dependensi berbahasa Indonesia.</description><date>2020</date><type>Thesis:Thesis</type><type>PeerReview:NonPeerReviewed</type><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/1/HALAMAN_AWAL.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/2/DAFTAR_PUSTAKA.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/3/BAB_I.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/4/BAB_II.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/5/BAB_III.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/6/BAB_IV.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/7/BAB_V.pdf</identifier><type>File:application/pdf</type><language>eng</language><identifier>http://kc.umn.ac.id/13262/8/LAMPIRAN.pdf</identifier><identifier> Anthony, Anthony (2020) Implementasi Representasi Kata Tingkat Karakter Menggunakan Embedding from Language Models (ELMo) pada Pengurai Dependensi Bahasa Indonesia. Bachelor Thesis thesis, Universitas Multimedia Nusantara. </identifier><recordID>13262</recordID></dc>
language eng
format Thesis:Thesis
Thesis
PeerReview:NonPeerReviewed
PeerReview
File:application/pdf
File
author Anthony, Anthony
title Implementasi Representasi Kata Tingkat Karakter Menggunakan Embedding from Language Models (ELMo) pada Pengurai Dependensi Bahasa Indonesia
publishDate 2020
topic T58.5-58.64 Information technology
url http://kc.umn.ac.id/13262/1/HALAMAN_AWAL.pdf
http://kc.umn.ac.id/13262/2/DAFTAR_PUSTAKA.pdf
http://kc.umn.ac.id/13262/3/BAB_I.pdf
http://kc.umn.ac.id/13262/4/BAB_II.pdf
http://kc.umn.ac.id/13262/5/BAB_III.pdf
http://kc.umn.ac.id/13262/6/BAB_IV.pdf
http://kc.umn.ac.id/13262/7/BAB_V.pdf
http://kc.umn.ac.id/13262/8/LAMPIRAN.pdf
http://kc.umn.ac.id/13262/
contents Tujuan dilakukannya penguraian dependensi adalah untuk mengetahui hubungan fungsional yang terjadi di antara kata, seperti misalnya hubungan subjek-objek di dalam kalimat. Untuk menguraikan kalimat bahasa Indonesia, morfologi kata perlu diketahui. Hal ini dikarenakan tata bahasa Indonesia banyak sekali melakukan pengimbuhan kata. Berdasarkan hal tersebut, informasi tentang morfologi seharusnya ikut disertakan. Beruntungnya, informasi tersebut bisa disertakan secara implisit oleh representasi kata. Misalnya, Embeddings from Language Models (ELMo) yang berkemampuan untuk menyimpan morfologis kata di dalam representasi kata miliknya. Tidak seperti representasi kata yang secara luas digunakan seperti word2vec ataupun Global Vectors (GloVe), ELMo mempergunakan metode yang berbeda yaitu Character Convolutional Neural Network (Char CNN). Metode ini ditujukan agar pengimbuhan kata bisa tersertakan di dalam representasi kata. Untuk membandingkan ELMo dengan word2vec, beberapa analisis dilakukan yang antara lain analisis kemiripan kata dan pengvisualisasian kata. Hasil analisis menunjukan bahwa representasi kata ELMo lebih baik dibanding word2vec dalam hal menyimpan morfologis kata. Kemudian, pengurai coba dilatih menggunakan representasi kata milik word2vec dan ELMo. Sesuai dugaan, pengurai yang menggunakan ELMo mendapatkan akurasi yang lebih baik dibandingkan dengan word2vec. Unlabeled Attachment Score (UAS) yang didapatkan oleh ELMo adalah sebesar 83.55% sedangkan word2vec 81.35%. Oleh sebab itu penelitian ini mengkonfirmasikan bahwa morfologis kata wajib diikutsertakan terutama pada tugas penguraian dependensi berbahasa Indonesia.
id IOS6965.13262
institution Universitas Multimedia Nusantara
institution_id 355
institution_type library:university
library
library Perpustakaan Universitas Multimedia Nusantara
library_id 306
collection Knowledge Center UMN
repository_id 6965
subject_area Business/Bisnis
Communication/Komunikasi
Art Apreciation/Apresiasi Seni
Data Processing, Computer Science/Pemrosesan Data, Ilmu Komputer, Teknik Informatika
city TANGERANG
province BANTEN
shared_to_ipusnas_str 1
repoId IOS6965
first_indexed 2020-12-19T03:50:33Z
last_indexed 2020-12-19T03:50:33Z
recordtype dc
_version_ 1686477458923061248
score 17.538404