Tampilan Petugas: Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Main Authors:	Loebis, Luthfia Justisia, Negara, Arif Bijaksana Putra, Safriadi, Novi
Format:	Article info application/pdf eJournal
Bahasa:	eng
Terbitan:	Universitas Islam Sumatera Utara , 2020
Subjects:	Hidden Markov Model Durasi Fonem bahasa Melayu Pontianak
Online Access:	https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986 https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219

ctrlnum	--jurnal.uisu.ac.id-index.php-index-oai:article-1986
fullrecord	<?xml version="1.0"?> <dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><title lang="en-US">Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model</title><creator>Loebis, Luthfia Justisia</creator><creator>Negara, Arif Bijaksana Putra</creator><creator>Safriadi, Novi</creator><subject lang="en-US">Hidden Markov Model; Durasi Fonem; bahasa Melayu Pontianak</subject><description lang="en-US">TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik.</description><publisher lang="en-US">Universitas Islam Sumatera Utara</publisher><contributor lang="en-US"/><date>2020-09-04</date><type>Journal:Article</type><type>Other:info:eu-repo/semantics/publishedVersion</type><type>Journal:Article</type><type>File:application/pdf</type><identifier>https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986</identifier><identifier>10.30743/infotekjar.v5i1.1986</identifier><source lang="en-US">InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan; Vol 5, No 1 (2020): InfoTekJar September: In Press; 80-88</source><source>2540-7600</source><source>2540-7597</source><source>10.30743/infotekjar.v5i1</source><language>eng</language><relation>https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf</relation><relation>https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219</relation><rights lang="en-US">Copyright (c) 2020 Luthfia Justisia Loebis, Arif Bijaksana Putra Negara, Novi Safriadi</rights><rights lang="en-US">https://creativecommons.org/licenses/by/4.0</rights><recordID>--jurnal.uisu.ac.id-index.php-index-oai:article-1986</recordID></dc>
language	eng
format	Journal:Article Journal Other:info:eu-repo/semantics/publishedVersion Other File:application/pdf File Journal:eJournal
author	Loebis, Luthfia Justisia Negara, Arif Bijaksana Putra Safriadi, Novi
title	Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model
publisher	Universitas Islam Sumatera Utara
publishDate	2020
topic	Hidden Markov Model Durasi Fonem bahasa Melayu Pontianak
url	https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986 https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219
contents	TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik.
id	IOS4523.--jurnal.uisu.ac.id-index.php-index-oai:article-1986
institution	Universitas Islam Sumatera Utara
institution_id	1254
institution_type	library:university library
library	Universitas Islam Sumatera Utara
library_id	1095
collection	InfoTekJar (Jurnal Nasional Informatika dan Teknologi Jaringan)
repository_id	4523
subject_area	Computer Modeling and Simulation/Model dan Simulasi Komputer Computer Communications Networks/Jaringan Komunikasi Komputer Algorithms/Algoritma Computer Security, Data Security/Keamanan Komputer, Keamanan Data
city	KOTA MEDAN
province	SUMATERA UTARA
shared_to_ipusnas_str	1
repoId	IOS4523
first_indexed	2020-09-24T21:34:07Z
last_indexed	2020-11-30T06:07:46Z
recordtype	dc
_version_	1686136660945797120
score	17.538404

Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Lihat Juga