(0721) 8030188    [email protected]   

Analisis Pengelompokan Skripsi Mahasiswa Fakultas Sains Institut Teknologi Sumatera dengan Metode Agglomerative Hierarchical Clustering


Skripsi merupakan karya ilmiah mahasiswa sarjana berdasarkan penelitian dalam bidang tertentu. Di Fakultas Sains Institut Teknologi Sumatera (ITERA), jumlah skripsi yang terus meningkat belum didukung sistem pengelompokan topik yang sistematis. Penelitian ini menerapkan metode Agglomerative Hierarchical Clustering (AHC) untuk mengelompokkan skripsi berdasarkan kemiripan topik. Data yang digunakan berupa 575 judul skripsi dari sembilan program studi di Fakultas Sains ITERA tahun 2024. Tahapan penelitian meliputi preprocessing teks, perhitungan bobot dengan metode TF-IDF, dan reduksi dimensi menggunakan Principal Component Analysis (PCA). Pengelompokan dilakukan dengan tiga metode linkage, yaitu average, single, dan complete, serta pengukuran kemiripan menggunakan cosine distance. Evaluasi menggunakan nilai silhouette coefficient untuk menilai kualitas hasil clustering. Hasil menunjukkan bahwa metode average linkage memberikan hasil terbaik dengan nilai silhouette coefficient sebesar 0.3091 pada titik potong 0.86. Topik tiap cluster ditentukan dari lima kata kunci dominan berdasarkan nilai TF-IDF tertinggi sebagai label representatif. Penelitian ini diharapkan menjadi langkah awal dalam pengembangan sistem pengelompokan topik skripsi yang lebih terstruktur dan informatif.

URI
https://repo.itera.ac.id/depan/submission/SB2508250037

Keyword
Agglomerative Hierarchical Clustering, Cosine Dist