Analisis Pengelompokan Skripsi Mahasiswa Fakultas Sains Institut Teknologi Sumatera dengan Metode Agglomerative Hierarchical Clustering
Skripsi merupakan karya ilmiah mahasiswa sarjana berdasarkan
penelitian dalam bidang tertentu. Di Fakultas Sains Institut Teknologi
Sumatera (ITERA), jumlah skripsi yang terus meningkat belum
didukung sistem pengelompokan topik yang sistematis. Penelitian ini
menerapkan metode Agglomerative Hierarchical Clustering (AHC)
untuk mengelompokkan skripsi berdasarkan kemiripan topik. Data
yang digunakan berupa 575 judul skripsi dari sembilan program
studi di Fakultas Sains ITERA tahun 2024. Tahapan penelitian
meliputi preprocessing teks, perhitungan bobot dengan metode
TF-IDF, dan reduksi dimensi menggunakan Principal Component
Analysis (PCA). Pengelompokan dilakukan dengan tiga metode
linkage, yaitu average, single, dan complete, serta pengukuran
kemiripan menggunakan cosine distance. Evaluasi menggunakan
nilai silhouette coefficient untuk menilai kualitas hasil clustering.
Hasil menunjukkan bahwa metode average linkage memberikan
hasil terbaik dengan nilai silhouette coefficient sebesar 0.3091
pada titik potong 0.86. Topik tiap cluster ditentukan dari lima
kata kunci dominan berdasarkan nilai TF-IDF tertinggi sebagai
label representatif. Penelitian ini diharapkan menjadi langkah awal
dalam pengembangan sistem pengelompokan topik skripsi yang lebih
terstruktur dan informatif.
URI
https://repo.itera.ac.id/depan/submission/SB2508250037
Keyword
Agglomerative Hierarchical Clustering, Cosine Dist