(0721) 8030188    pusat@itera.ac.id   

Analisis Perbandingan Distance Measure Pada K-Means Clustering Menggunakan Metode Evaluasi Silhouette Coefficient (Studi Kasus : Kepadatan Penduduk Kota Bandar Lampung)


Distance measure digunakan untuk mengukur kemiripan data dalam suatu cluster. Hasil dari proses clustering akan menghasilkan hasil yang berbeda apabila distance measure yang digunakan berbeda [1]. Oleh karena itu, diperlukan penelitian untuk menganalisis perbandingan dari berbagai distance measure pada K-Means Clustering agar dapat menentukan metode distance measure yang paling optimal dalam proses clustering. Analisis dilakukan berdasarkan evaluasi nilai Silhouette Coefficient dan pengujian kompleksitas waktu pada dua dataset, hasilnya adalah berdasarkan nilai Silhouette Coefficient nya pada dataset per kecamatan memperoleh bahwa Chebyshev Distance sebagai metode distance measure teroptimal untuk kasus ini dengan nilai Silhouette Coefficient tertinggi yaitu 0,4679530554 dibandingkan metode Euclidean Distance (0,4600011258), dan Minkowski Distance (0,4600011258). Dan untuk dataset per kelurahan didapat hasil bahwa Minkowski Distance sebagai metode distance measure teroptimal untuk kasus ini dengan nilai Silhouette Coefficient tertinggi yaitu 0,4737214349 dibandingkan metode Euclidean Distance (0,4717568953), dan Chebyshev Distance (0,4690807084). Maka dapat diketahui bahwa metode perhitungan jarak Chebyshev Distance memiliki kualitas cluster yang baik apabila digunakan pada dataset dengan jumlah sedikit, dan untuk dataset dengan jumlah yang lebih banyak Minkowski Distance lebih optimal pada kasus ini. Berdasarkan pengujian kompleksitas waktu pada dataset per kecamatan, didapat hasil bahwa Euclidean Distance sebagai metode distance measure teroptimal pada kasus ini dengan waktu tercepat yaitu 0,0531 s dibandingkan metode Euclidean Distance (0,0534 s), dan Minkowski Distance (0,0549 s). Dan untuk dataset per kelurahan didapat hasil bahwa Chebyshev Distance sebagai metode distance measure teroptimal pada kasus ini dengan dengan waktu tercepat yaitu 0,0721 s dibandingkan metode Euclidean Distance (0,0732 s), dan Chebyshev Distance (0,0679 s). Kata Kunci : Clustering, Distance measure, K-Means Clustering, Silhouette Coefficient

URI
https://repo.itera.ac.id/depan/submission/SB2106020009

Keyword