(0721) 8030188    pusat@itera.ac.id   

ANALISIS PERBANDINGAN DISTANCE MEASURE PADA ALGORITMA K-MEANS DALAM TINGKAT KRIMINALITAS MENGGUNAKAN METODE EVALUASI SILHOUETTE COEFFICIENT


Clustering adalah teknik data mining yang digunakan untuk proses mengelompokkan data atau objek ke dalam cluster berdasarkan kesamaan atribut mereka. Hasil dari clustering adalah data dengan ciri-ciri mirip satu sama lain dan berbeda dari data di cluster lain. Sedangkan K-means merupakan metode data clustering yang bersifat non hirarki untuk membatasi data menjadi beberapa cluster yang memiliki kemiripan satu sama lain pada kelompoknya dan berbeda dengan kelompok lainnya. Untuk mengetahui seberapa mirip data dalam suatu cluster, maka digunakan distance measure. Dalam penelitian ini dilakukan pengujian pada ketiga distance measure yaitu Euclidean Distance, Manhattan Distance, Chebyshev Distance menggunakan metode Silhoutte Coefficient pada kasus tingkat kriminalitas di wilayah Bandar Lampung tahun 2019 sampai 2022. Tujuan penelitian ini adalah mengetahui hasil perhitungan pada distance measure untuk menentukan distance measure paling optimal dan mengevaluasi ketiga distance measure tersebut. Langkah-langkah yang dilakukan pada proses penelitian ini adalah mengumpulkan data, pre-processing data, normalisasi dan k-means clustering dengan perbandingan tiga distance measure. Kemudian dilakukan evaluasi menggunakan Silhouette Coefficient. Serta dilakukan pengujian kompleksitas waktu dan analisis hasil pengujian. Hasil yang didapatkan pada penelitian ini adalah Manhattan Distance paling optimal dengan silhouette scores paling tinggi sebesar 0.5943. Nilai tersebut paling tinggi dibandingkan dengan Euclidean Distance dengan nilai 0.5064 dan Chebyshev Distance dengan nilai 0.5349. Untuk hasil pengujian kompleksitas waktu, didapatkan kesimpulan bahwa metode paling cepat adalah Euclidean Distance dengan waktu rata-rata 0.539 detik. Hasil ini lebih cepat dibandingkan metode Manhattan Distance dengan waktu rata-rata 0.659 detik dan Chebyshev Distance dengan waktu rata-rata 0.628 detik.

URI
https://repo.itera.ac.id/depan/submission/SB2406070039

Keyword
Clustering, K-Means, Data, Distance Measure, Silho