Pemampatan Tata Teks Berbahasa Indonesia Dengan Metode Huffman Menggunakan Panjang Simbol Bervariasi

Main Author: Septianto, TriYoga
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2015
Subjects:
Online Access: http://repository.ub.ac.id/143953/1/Skripsi_-_Tri_Yoga_Septianto_0180633084.pdf
http://repository.ub.ac.id/143953/
Daftar Isi:
  • Pemampatan data merupakan salah satu upaya untuk memperbesar ruang penyimpanan agar data lebih banyak yang dapat tersimpan atau untuk mempercepat suatu proses pengiriman data. Huffman Coding merupakan salah satu metode pemampatan data yang menggunakan frekuensi atau probabilitas kemunculan suatu simbol atau karakter sebagai acuan pemempatan datanya, terutama berkas teks. Berkas teks memiliki kencenderungan perulangan yang sama untuk kosakata-kosakatnya. Dari pemrosesan menggunakan metode Huffman akan menghasilkan prefixed-code yang merupakan representasi dari suatu simbol. Prefixed-code terpendek diberikan kesimbol yang memiliki kemunculan tertinggi. Pengujian dilakukan dengan menggunakan panjang simbol 1 sampai 6 karakter dan menggunakan 5 buah berkas berbahasa Indonesia dengan ukuran masing-masing, 2 KB, 4 KB, 6 KB, 8 KB, dan 10 KB. Hasil pengujian menggunakan rasio perbandingan antara besar berkas asli dengan besar berkas keluaran. Salah satu pengujian dilakukan dengan variasi panjang simbol pada berkas teks sebesar 10 KB akan menghasilkan rasio untuk panjang 2 sebesar 52,8% lama proses 39 detik, panjang 3 sebesar 43,5% lama proses 43 detik, panjang 4 sebesar 35,2% lama proses 30 detik, panjang 6 sebesar 28,8% lama proses 28 detik dan panjang 6 sebesar 23,4% lama proses 25 detik. Pengembangan lebih lanjut disarankan agar aplikasi dapat mengenali bentuk berkas teks yang memiliki properti-properti teks yang kompleks.