Comparison analysis of Euclidean and Gower distance measures on k-medoids cluster
Main Authors: | Aditya, Agil, Sari, Betha Nurina, Padilah, Tesa Nur |
---|---|
Format: | Article info application/pdf eJournal |
Bahasa: | ind |
Terbitan: |
Department of Computer Engineering, Engineering Faculty, Universitas Diponegoro
, 2021
|
Subjects: | |
Online Access: |
https://jtsiskom.undip.ac.id/article/view/13747 https://jtsiskom.undip.ac.id/article/view/13747/12648 |
Daftar Isi:
- K-medoids clustering uses distance measurement to find and classify data that have similarities and inequalities. The distance measurement method selection can affect the clustering performance for a dataset. Several studies use the Euclidean and Gower distance as measurement methods in numerical data clustering. This study aims to compare the performance of the k-medoids clustering on a numerical dataset using the Euclidean and Gower distance. This study used seven numerical datasets and Silhouette, Dunn, and Connectivity indexes in the clustering evaluation. The Euclidean distance is superior in two values of Silhouette and Connectivity indexes so that Euclidean has a good data grouping structure, while the Gower is superior in Dunn index showing that the Gower has better cluster separation compared to Euclidean. This study shows that the Euclidean distance is superior to the Gower in applying the k-medoids algorithm with a numeric dataset.
- Klastering k-medoids menggunakan metode jarak untuk mencari dan mengelompokkan data yang memiliki kesamaan dan ketidaksamaan. Penentuan metode pengukuran jarak adalah hal yang penting karena mempengaruhi performa hasil klaster k-medoids. Beberapa kajian menyatakan bahwa metode Euclidean dan Gower bisa digunakan sebagai metode pengukuran pada klastering dengan data numerik. Penelitian ini bertujuan untuk melakukan perbandingan performa hasil klastering k-medoids pada dataset numerik menggunakan metode Euclidean dan Gower. Penelitian ini menggunakan tujuh dataset numerik dan evaluasi hasil klastering menggunakan nilai Silhouette, Dunn, dan Connectivity. Metode jarak Euclidean unggul pada dua nilai evaluasi Silhouette dan Connectivity yang menunjukkan bahwa Euclidean memiliki struktur pengelompokan data yang baik, sedangkan Gower unggul pada satu nilai evaluasi Dunn yang menunjukkan Gower memiliki pemisah antar klaster yang baik dibanding Euclidean. Penelitian ini menunjukkan bahwa metode Euclidean lebih unggul daripada metode Gower pada penerapan algoritma k-medoids dengan dataset bertipe numerik.