ANALISIS PERBANDINGAN DISTANCE MEASURE PADA ALGORITMA K-MEANS DALAM TINGKAT KRIMINALITAS MENGGUNAKAN METODE EVALUASI SILHOUETTE COEFFICIENT
Clustering adalah teknik data mining yang digunakan untuk proses mengelompokkan data atau
objek ke dalam cluster berdasarkan kesamaan atribut mereka. Hasil dari clustering adalah data
dengan ciri-ciri mirip satu sama lain dan berbeda dari data di cluster lain. Sedangkan K-means
merupakan metode data clustering yang bersifat non hirarki untuk membatasi data menjadi
beberapa cluster yang memiliki kemiripan satu sama lain pada kelompoknya dan berbeda dengan
kelompok lainnya. Untuk mengetahui seberapa mirip data dalam suatu cluster, maka digunakan
distance measure.
Dalam penelitian ini dilakukan pengujian pada ketiga distance measure yaitu Euclidean
Distance, Manhattan Distance, Chebyshev Distance menggunakan metode Silhoutte Coefficient
pada kasus tingkat kriminalitas di wilayah Bandar Lampung tahun 2019 sampai 2022. Tujuan
penelitian ini adalah mengetahui hasil perhitungan pada distance measure untuk menentukan
distance measure paling optimal dan mengevaluasi ketiga distance measure tersebut.
Langkah-langkah yang dilakukan pada proses penelitian ini adalah mengumpulkan data, preprocessing data, normalisasi dan k-means clustering dengan perbandingan tiga distance measure.
Kemudian dilakukan evaluasi menggunakan Silhouette Coefficient. Serta dilakukan pengujian
kompleksitas waktu dan analisis hasil pengujian.
Hasil yang didapatkan pada penelitian ini adalah Manhattan Distance paling optimal dengan
silhouette scores paling tinggi sebesar 0.5943. Nilai tersebut paling tinggi dibandingkan dengan
Euclidean Distance dengan nilai 0.5064 dan Chebyshev Distance dengan nilai 0.5349. Untuk hasil
pengujian kompleksitas waktu, didapatkan kesimpulan bahwa metode paling cepat adalah
Euclidean Distance dengan waktu rata-rata 0.539 detik. Hasil ini lebih cepat dibandingkan metode
Manhattan Distance dengan waktu rata-rata 0.659 detik dan Chebyshev Distance dengan waktu
rata-rata 0.628 detik.
URI
https://repo.itera.ac.id/depan/submission/SB2406050060
Keyword
Clustering, K-Means, Data, Distance Measure, Silho