Pengenalan Suara Menggunakan Algoritma Fast Fourier Transform (FFT) Dengan Algoritma Mel Frequency Cepstrum Coeffisient (MFCC) Sebagai Ekstrasi Ciri
Main Author: | Wardana, MohammadMahendraJaya |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2011
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/152561/1/051102075.pdf http://repository.ub.ac.id/152561/ |
Daftar Isi:
- Pengenalan suara adalah teknologi masa depan yang menggantikan cara interaksi manusia dengan komputer dengan menggabungkan beberapa disiplin ilmu seperti pengenalan sinyal dan pengenalan pola dimana interaksi user dengan sistem dapat dilakukan dengan memberikan inputan suara. Algoritma Mel Frequency Cepstrum Coeffisient (MFCC) sebagai penyimpan karakteristik dari suatu sinyal suara setelah dari proses MFCC dilakukan proses pemetaan oleh vector quantization (VQ) yang disebut cluster dimana cluster tersebut dikelompokkan dengan algoritma K-mean yang kemudian dicari dengan pengukuran jarak euclidean distance untuk melakukan perbandingan dari data input dengan data yang ada pada database . Berdasarkan uji coba yang dilakukan terhadap 30 kata yang diucapkan oleh 3 orang laki-laki 3 orang perempuan, dihasilkan untuk data learning bahwa pada codebook 16 nilai Word Error Rate (WER) adalah 63.33%, codebook 32 nilai WER 50%, codebook 64 nilai WER 46.67%, codebook 128 nilai WER 40% dan pada codebook 256 didapat nilai WER 47%. Pada codebook 16 sampai 128 nilai WER semakin kecil, sedangkan pada codebook 256 nilai WER mengalami peningkatan. Sedangkan untuk data non-learning diketahui bahwa pada codebook 16 nilai WER adalah 50%, codebook 32 nilai WER 40%, codebook 64 nilai WER 30%, codebook 128 nilai WER 23.33% dan pada codebook