Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model
Main Authors: | Loebis, Luthfia Justisia, Negara, Arif Bijaksana Putra, Safriadi, Novi |
---|---|
Format: | Article info application/pdf eJournal |
Bahasa: | eng |
Terbitan: |
Universitas Islam Sumatera Utara
, 2020
|
Subjects: | |
Online Access: |
https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986 https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219 |
ctrlnum |
--jurnal.uisu.ac.id-index.php-index-oai:article-1986 |
---|---|
fullrecord |
<?xml version="1.0"?>
<dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><title lang="en-US">Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model</title><creator>Loebis, Luthfia Justisia</creator><creator>Negara, Arif Bijaksana Putra</creator><creator>Safriadi, Novi</creator><subject lang="en-US">Hidden Markov Model; Durasi Fonem; bahasa Melayu Pontianak</subject><description lang="en-US">TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik.</description><publisher lang="en-US">Universitas Islam Sumatera Utara</publisher><contributor lang="en-US"/><date>2020-09-04</date><type>Journal:Article</type><type>Other:info:eu-repo/semantics/publishedVersion</type><type>Journal:Article</type><type>File:application/pdf</type><identifier>https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986</identifier><identifier>10.30743/infotekjar.v5i1.1986</identifier><source lang="en-US">InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan; Vol 5, No 1 (2020): InfoTekJar September: In Press; 80-88</source><source>2540-7600</source><source>2540-7597</source><source>10.30743/infotekjar.v5i1</source><language>eng</language><relation>https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf</relation><relation>https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219</relation><rights lang="en-US">Copyright (c) 2020 Luthfia Justisia Loebis, Arif Bijaksana Putra Negara, Novi Safriadi</rights><rights lang="en-US">https://creativecommons.org/licenses/by/4.0</rights><recordID>--jurnal.uisu.ac.id-index.php-index-oai:article-1986</recordID></dc>
|
language |
eng |
format |
Journal:Article Journal Other:info:eu-repo/semantics/publishedVersion Other File:application/pdf File Journal:eJournal |
author |
Loebis, Luthfia Justisia Negara, Arif Bijaksana Putra Safriadi, Novi |
title |
Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model |
publisher |
Universitas Islam Sumatera Utara |
publishDate |
2020 |
topic |
Hidden Markov Model Durasi Fonem bahasa Melayu Pontianak |
url |
https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986 https://jurnal.uisu.ac.id/index.php/infotekjar/article/view/1986/pdf https://jurnal.uisu.ac.id/index.php/infotekjar/article/downloadSuppFile/1986/219 |
contents |
TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik. |
id |
IOS4523.--jurnal.uisu.ac.id-index.php-index-oai:article-1986 |
institution |
Universitas Islam Sumatera Utara |
institution_id |
1254 |
institution_type |
library:university library |
library |
Universitas Islam Sumatera Utara |
library_id |
1095 |
collection |
InfoTekJar (Jurnal Nasional Informatika dan Teknologi Jaringan) |
repository_id |
4523 |
subject_area |
Computer Modeling and Simulation/Model dan Simulasi Komputer Computer Communications Networks/Jaringan Komunikasi Komputer Algorithms/Algoritma Computer Security, Data Security/Keamanan Komputer, Keamanan Data |
city |
KOTA MEDAN |
province |
SUMATERA UTARA |
shared_to_ipusnas_str |
1 |
repoId |
IOS4523 |
first_indexed |
2020-09-24T21:34:07Z |
last_indexed |
2020-11-30T06:07:46Z |
recordtype |
dc |
_version_ |
1686136660945797120 |
score |
17.538404 |