Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Main Authors: Loebis, Luthfia Justisia, Negara, Arif Bijaksana Putra, Safriadi, Novi
Format: Article info application/pdf eJournal
Bahasa: eng
Terbitan: Universitas Islam Sumatera Utara , 2020
Subjects:
Online Access: https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986
https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf
https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219
ctrlnum --jurnal.uisu.ac.id-index.php-index-oai:article-1986
fullrecord <?xml version="1.0"?> <dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><title lang="en-US">Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model</title><creator>Loebis, Luthfia Justisia</creator><creator>Negara, Arif Bijaksana Putra</creator><creator>Safriadi, Novi</creator><subject lang="en-US">Hidden Markov Model; Durasi Fonem; bahasa Melayu Pontianak</subject><description lang="en-US">TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik.</description><publisher lang="en-US">Universitas Islam Sumatera Utara</publisher><contributor lang="en-US"/><date>2020-09-04</date><type>Journal:Article</type><type>Other:info:eu-repo/semantics/publishedVersion</type><type>Journal:Article</type><type>File:application/pdf</type><identifier>https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986</identifier><identifier>10.30743/infotekjar.v5i1.1986</identifier><source lang="en-US">InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan; Vol 5, No 1 (2020): InfoTekJar September: In Press; 80-88</source><source>2540-7600</source><source>2540-7597</source><source>10.30743/infotekjar.v5i1</source><language>eng</language><relation>https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf</relation><relation>https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219</relation><rights lang="en-US">Copyright (c) 2020 Luthfia Justisia Loebis, Arif Bijaksana Putra Negara, Novi Safriadi</rights><rights lang="en-US">https://creativecommons.org/licenses/by/4.0</rights><recordID>--jurnal.uisu.ac.id-index.php-index-oai:article-1986</recordID></dc>
language eng
format Journal:Article
Journal
Other:info:eu-repo/semantics/publishedVersion
Other
File:application/pdf
File
Journal:eJournal
author Loebis, Luthfia Justisia
Negara, Arif Bijaksana Putra
Safriadi, Novi
title Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model
publisher Universitas Islam Sumatera Utara
publishDate 2020
topic Hidden Markov Model
Durasi Fonem
bahasa Melayu Pontianak
url https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986
https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf
https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219
contents TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik.
id IOS4523.--jurnal.uisu.ac.id-index.php-index-oai:article-1986
institution Universitas Islam Sumatera Utara
institution_id 1254
institution_type library:university
library
library Universitas Islam Sumatera Utara
library_id 1095
collection InfoTekJar (Jurnal Nasional Informatika dan Teknologi Jaringan)
repository_id 4523
subject_area Computer Modeling and Simulation/Model dan Simulasi Komputer
Computer Communications Networks/Jaringan Komunikasi Komputer
Algorithms/Algoritma
Computer Security, Data Security/Keamanan Komputer, Keamanan Data
city KOTA MEDAN
province SUMATERA UTARA
shared_to_ipusnas_str 1
repoId IOS4523
first_indexed 2020-09-24T21:34:07Z
last_indexed 2020-11-30T06:07:46Z
recordtype dc
_version_ 1686136660945797120
score 17.538404