(0721) 8030188    [email protected]   

PERBANDINGAN DATA NORMALISASI MINMAX, ZSCORE, DECIMAL SCALING, DAN TANPA NORMALISASI PADA AVERAGE LINKAGE CLUSTERING


Clustering adalah teknik pengelompokan data tanpa label berdasarkan kemiripan antar data. Penelitian ini bertujuan untuk menganalisis pengaruh empat metode normalisasi (tanpa normalisasi, Minmax, Zscore, dan Decimal Scaling) terhadap hasil clustering menggunakan algoritma Average Linkage. Evaluasi hasil clustering dilakukan dengan menghitung nilai Cophenetic Correlation Coefficient (CCC). Penelitian menggunakan tiga dataset numerik dengan dimensi kecil (Iris), sedang (Winequality-red), dan besar (Parkinsons_updrs). Semua dataset telah dibersihkan dan tidak mengandung label. Hasil penelitian menunjukkan bahwa metode normalisasi berpengaruh terhadap nilai CCC namun tidak ada metode yang selalu unggul. Pada dataset Iris, metode tanpa normalisasi dan Decimal Scaling memberikan nilai CCC tertinggi. Pada dataset Winequality-red, metode tanpa normalisasi menghasilkan nilai terbaik. Sedangkan pada Parkinsons_updrs, Zscore memberikan hasil CCC tertinggi. Hal ini menunjukkan bahwa efektivitas metode normalisasi sangat bergantung pada karakteristik dataset.

URI
https://repo.itera.ac.id/depan/submission/SB2506030061

Keyword
Clustering Normalisasi Average Linkage CCC Data Numerik