Pengaruh Urutan dan Pengkombinasian Preprocessing Terhadap Klasifikasi Emosi pada Teks Bahasa Indonesia Dengan Algoritma SVM (Support Vector Machine)
Emosi merupakan sebuah keadaan psikis yang kompleks serta mempengaruhi suatu prilaku manusia. Emosi juga dapat diekspresikan kedalam kata kata, frasa maupun kalimat. Terdapat 4 emosi dasar seperti marah, senang, sedih, dan takut dataset ISEAR merupakan dataset yang berisikan emosi, Pemilihan dataset ISEAR dikarenakan setiap entri label diberikan label emosi dasar dan dataset ISEAR sudah mencakup emosi dasar jika dibandingkan dengan penggunaan analisis sentiment yang hanya mencakup positif, netral dan negatif. Dataset yang digunakan untuk mengklasifikasi sebuah emosi berdasarkan teks tidaklah selalu bebas dari noise sehingga diperlukannya tahapan preprocessing Penelitian ini membahas secara khusus mengenai teknik preprocessing dengan melakukan secara keseluruhan pengkombinasian preprocessing cleaning text, lowering case,normalisasi, stemming, stopword, tokenizing dan teknik pengurutan pada normalisasi, stemming dan stopword untuk mengetahui pengaruh dari teknik preprocessing terhadap kinerja model. Metode klasifikasi yang digunakan adalah SVM dikarenakan mampu mengklasifikasikan data berdimensi tinggi sesuai dengan data pada penlitian ini yaitu data yang berupa teks. Hasil dari penelitian menunjukan bahwa pengkombinsaian dan pengurutan mempengaruhi kinerja suatu model dengan teknik preprocessing kombinasi pada lowering case, stemming dan stopword menghasilkan kinerja yang paling optimal dan tertinggi dengan 81.4% untuk akurasi, 82.4% untuk precision dan 80.5% untuk recall dan 81.2% untuk f1 score. Pengujian yang melibatkan stemming dan stopword memberikan pengaruh yang baik dalam meningkatkan kinerja pemodelan, Tokenizing menjadi yang paling rendah dengan 75.2% untuk akurasi, 76.4% untuk precision, 74.2% untuk recall dan 74.8% untuk f1 score.
URI
https://repo.itera.ac.id/depan/submission/SB2409250164
Keyword
Emosi ISEAR Preprocessing SVM Klasifikasi