ANALISIS PERBANDINGAN DISTANCE MEASURE PADA ALGORITMA K-MEANS DALAM TINGKAT KRIMINALITAS MENGGUNAKAN METODE EVALUASI SILHOUETTE COEFFICIENT
		
		
		
			Clustering adalah teknik data mining yang digunakan untuk proses mengelompokkan data atau 
objek ke dalam cluster berdasarkan kesamaan atribut mereka. Hasil dari clustering adalah data 
dengan ciri-ciri mirip satu sama lain dan berbeda dari data di cluster lain. Sedangkan K-means
merupakan metode data clustering yang bersifat non hirarki untuk membatasi data menjadi 
beberapa cluster yang memiliki kemiripan satu sama lain pada kelompoknya dan berbeda dengan 
kelompok lainnya. Untuk mengetahui seberapa mirip data dalam suatu cluster, maka digunakan 
distance measure.
Dalam penelitian ini dilakukan pengujian pada ketiga distance measure yaitu Euclidean 
Distance, Manhattan Distance, Chebyshev Distance menggunakan metode Silhoutte Coefficient
pada kasus tingkat kriminalitas di wilayah Bandar Lampung tahun 2019 sampai 2022. Tujuan 
penelitian ini adalah mengetahui hasil perhitungan pada distance measure untuk menentukan 
distance measure paling optimal dan mengevaluasi ketiga distance measure tersebut.
Langkah-langkah yang dilakukan pada proses penelitian ini adalah mengumpulkan data, preprocessing data, normalisasi dan k-means clustering dengan perbandingan tiga distance measure. 
Kemudian dilakukan evaluasi menggunakan Silhouette Coefficient. Serta dilakukan pengujian 
kompleksitas waktu dan analisis hasil pengujian.
Hasil yang didapatkan pada penelitian ini adalah Manhattan Distance paling optimal dengan 
silhouette scores paling tinggi sebesar 0.5943. Nilai tersebut paling tinggi dibandingkan dengan 
Euclidean Distance dengan nilai 0.5064 dan Chebyshev Distance dengan nilai 0.5349. Untuk hasil
pengujian kompleksitas waktu, didapatkan kesimpulan bahwa metode paling cepat adalah 
Euclidean Distance dengan waktu rata-rata 0.539 detik. Hasil ini lebih cepat dibandingkan metode 
Manhattan Distance dengan waktu rata-rata 0.659 detik dan Chebyshev Distance dengan waktu 
rata-rata 0.628 detik. 
			URI 
			
https://repo.itera.ac.id/depan/submission/SB2406050060 
			Keyword 
			
Clustering, K-Means, Data, Distance Measure, Silho