Analisa Perbandingan Kinerja File System GlusterFS dan HDFS dengan Distribusi Striped dan Replicated
Main Author: | Syafi’i, M. Irfan |
---|---|
Format: | Thesis NonPeerReviewed Book |
Bahasa: | eng |
Terbitan: |
, 2018
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/14083/1/M.%20Irfan%20Syafi%E2%80%99i.pdf http://repository.ub.ac.id/14083/ |
Daftar Isi:
- Big Data merupakan istilah yang digunakan untuk menggambarkan pertumbuhan data yang besar, baik data terstruktur maupun data tidak terstrukur. Big Data mempuyai tiga karakeristik utama yaitu volume, velocity, dan variety. Permasalahan yang timbul dengan semakin berkembangnya Big Data adalah bagaimana cara menyimpan data tersebut. Data yang terus tumbuh membesar setiap waktu membutuhkan ruang penyimpanan yang besar pula. Hal ini tentu tidak akan mampu bila ruang penyimpanan tersebut berada dalam satu mesin (single node/host). Sistem file terdistribusi merupakan modul penyimpanan dan pengelolaan file yang terdiri dari banyak mesin (multi node/host). Penelitian ini bertujuan untuk membandingkan kinerja dua file system yakni GlusterFS dan HDFS dalam melakukan penyimpanan file terdistribusi dengan skenario distribusi striped dan replicated. Penelitian berbatas pada pengukuran kinerja file system dalam melakukan operasional write/read file. Hasil pengujian menunjukkan bahwa GlusterFS memiliki kinerja yang lebih ringan dalam melakukan operasional write file dengan perolehan throughput sebesar 44,54 MBps, waktu eksekusi selama 58,54 detik, beban penggunaan CPU sebesar 54,83% dan penggunaan memori sebesar 3,6%. Sedangkan HDFS, memiliki kinerja optimal saat operasional read file diperoleh hasil rata-rata throughput sebesar 194,37 MBps, waktu eksekusi selama 16,01 detik, beban penggunaan CPU sebesar 86,9% dan penggunaan memori sebesar 18,5%.