ANALISA DATA RETAIL MENGGUNAKAN METODE APRIORI PADA SISTEM TERDISTRIBUSI HADOOP
Main Author: | STEVEN LIUNARDI |
---|---|
Format: | Bachelors |
Bahasa: | ind |
Terbitan: |
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA
, 2018
|
Subjects: | |
Online Access: |
http://etd.unsyiah.ac.id//index.php?p=show_detail&id=49577 |
Daftar Isi:
- Pada era teknologi ini, perkembangan data semakin pesat. Data dapat bersumber dari banyak media perangkat dalam berbagai format. Transaksi penjualan merupakan salah satu penghasil data yang besar. Pengolahan data yang besar menimbulkan masalah waktu dalam analisis sehingga harus dilakukan secepat mungkin agar hasilnya dapat dimanfaatkan segera sesuai kebutuhan. Hal tersebut dapat ditangani secara paralel menggunakan Hadoop. Kinerja pada mesin Hadoop dapat dipantau menggunakan Ambari YAVA. Pada penelitian ini, dataset transaksi sebanyak 10 juta baris dibangkitkan dengan program Java dan dilakukan analisis menggunakan metode Apriori yang diterapkan pada mesin tunggal, Hadoop dengan 1 slave node dan 2 slave node. Perbandingan ini dilakukan untuk memahami cara penerapan algoritma Apriori pada setiap mesin, membandingkan interval waktu dalam proses data pada setiap mesin, dan mengetahui dampak perubahan waktu yang dihasilkan dari setiap mesin. Hasil penelitian menunjukkan bahwa waktu analisis data yang diperlukan oleh mesin tunggal adalah 603 menit, sedangkan pada Hadoop 1 slave adalah 150 menit, diikuti dengan Hadoop 2 slave yaitu selama 118 menit. Dari hasil tersebut, dapat disimpulkan bahwa penggunaan 1 slave dapat menambah kecepatan proses sebesar 3.02 kali dan 2 slave sebesar 4.11 kali lebih cepat dari mesin tunggal. Penambahan slave node pada Hadoop sangat berpengaruh pada kecepatan proses data.Kata kunci: Apache Hadoop, Apache Ambari YAVA, Apriori, Association Rule
- Banda Aceh