(0721) 8030188    pusat@itera.ac.id   

ANALISIS PERBANDINGAN ALGORITMA K-MEANS CLUSTERING MENGGUNAKAN EUCLIDEAN DISTANCE, MANHATTAN DISTANCE DAN CANBERRA DISTANCE PADA DATA PASIEN DIABETES


Diabetes merupakan suatu penyakit kadar gula dalam darah yang melebihi normal. Banyaknya data pasien penderita diabetes yang tercatat pada sistem dapat diolah untuk mengetahui informasi yang tersembunyi dari data tersebut. Salah satu cara untuk menganalisa data pasien dengan jumlah yang besar yaitu dengan menggunakan teknik data mining pengelompokkan data atau bisa disebut clustering. Ada beberapa algoritma yang dapat digunakan dalam melakukan teknik clustering tersebut salah satunya adalah K-Means Clustering. Akan tetapi Algoritma tersebut masih memiliki beberapa kekurangan salah satunya adalah tingkat akurasi dari metode yang digunakan untuk melakukan pengelompokkan data berdasarkan kemiripan antar objek pada tiap cluster. Oleh karenanya untuk mengatasi permasalahan tersebut dalam penelitian ini dilakukan perbandingan antara tiga metode perhitungan jarak yaitu Euclidean Distance, Manhattan Distance, dan Canberra Distance dengan metode pengujian Silhouette Coefficient untuk mengetahui metode yang paling optimal. Hasil yang didapatkan pada penelitian ini menunjukkan bahwa dari ketiga metode yang digunakan metode Euclidean Distance merupakan metode yang paling optimal dengan nilai silhouette coefficient 0,977829067 (Strong Structure), selanjutnya Manhattan Distance dengan nilai silhouette coefficient 0,976926954 (Strong Structure) dan terakhir Canberra Distance dengan nilai silhouette coefficient 0,901333534 (Strong Structure). Pada sisi efisiensi metode perhitungan jarak yang paling efisien adalah Manhattan Distance dengan rata-rata waktu 78,5007896 s, selanjutnya Canberra Distance dengan rata-rata waktu 103,1215939 s dan Euclidean Distance dengan rata-rata waktu 129,060278 s.

URI
https://repo.itera.ac.id/depan/submission/SB2108030002

Keyword