PERBANDINGAN KERNEL ALGORITMA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI STRESS DAN ANXIETY BERBASIS TEXT MINING
Penanganan segera dalam kasus gangguan kesehatan mental sangat penting, mulai dari stress hingga anxiety yang sering dialami oleh remaja di Indonesia. Untuk dapat mengatasi gangguan kesehatan mental, sangat penting bagi penderita mendapatkan penanganan yang tepat. Adanya stigma masyarakat mengenai gangguan kesehatan mental membuat penderita menunda menjalani pengobatan. Dengan ini, diperlukan suatu pemodelan yang dapat digunakan untuk melakukan klasifikasi terkait kondisi kesehatan mental berdasarkan teks. Penelitian ini menggunakan dataset yang bersumber dari kaggle dan dilakukan pelabelan ulang oleh psikolog sebanyak 390 data yang terdiri dari label stress dan anxiety. Penelitian ini melakukan implementasi dan perbandingan terhadap kernel linear, polynomial, RBF, dan sigmoid pada algoritma Support Vector Machine. Penelitian ini melalui tahap preprocessing diantaranya cleaning, case folding, normalization, tokenization, stopwords removal, dan stemming. Selanjutnya, splitting data dilakukan dengan perbandingan 70:30 dan pembobotan kata menggunakan TF-IDF. Tahap pemodelan masing-masing kernel melalui tuning hyperparameter menggunakan bantuan GridSearchCV dan KFold. Akurasi tertinggi diperoleh kernel linear dan sigmoid sebesar 61.53%. Linear dan sigmoid berhasil melakukan klasifikasi dengan benar sebanyak 38 tweet anxiety dan 34 tweet stress. Kernel linear menggunakan nilai C = 1 dan sigmoid menggunakan C = 10 dan gamma = 0.1. Kernel polynomial dengan akurasi sebesar 59.82% menggunakan nilai C = 100, degree = 2, dan gamma = 0.1. Sedangkan, Kernel RBF memiliki akurasi yang paling rendah yaitu 56.41% menggunakan nilai C =
10 dan gamma = 0.1.
URI
https://repo.itera.ac.id/depan/submission/SB2502110038
Keyword
Support Vector Machine Kernel Text Mining Stress Anxiety