(0721) 8030188    [email protected]   

All of ITERA Repository
Titles

Perbandingan Metode Pelabelan Otomatis VADER, AFINN, TextBlob dengan Pendekatan Soft Voting untuk Analisis Sentimen Menggunakan Support Vector Machine


Keberhasilan analisis sentimen sangat dipengaruhi oleh kualitas data berlabel. Ketersediaan data sentimen berlabel pada ulasan berbahasa Indonesia yang digunakan dalam pelatihan model supervised learning masih terbatas karena ulasan pengguna biasanya bersifat unlabeled, sementara proses pelabelan manual membutuhkan waktu dan biaya yang besar. Oleh karena itu, penelitian ini bertujuan untuk menerapkan metode pelabelan sentimen otomatis berbasis leksikon serta menganalisis performa klasifikasi sentimen menggunakan algoritma Support Vector Machine (SVM). Pelabelan dilakukan menggunakan tiga metode leksikon, yaitu VADER, AFINN, dan TextBlob, yang kemudian dikombinasikan menggunakan pendekatan Soft Voting. Karena ketiga leksikon tersebut dikembangkan untuk Bahasa Inggris, teks ulasan terlebih dahulu diterjemahkan menggunakan DeepL Translator API sebelum proses pelabelan agar dapat diproses oleh leksikon yang digunakan. Skor sentimen dari masing-masing leksikon digabungkan melalui skema Soft Voting berdasarkan rata-rata skor probabilitas leksikon. Meskipun proses pelabelan menggunakan hasil terjemahan, tahap ekstraksi fitur tetap menggunakan teks asli berbahasa Indonesia yang telah melalui preprocessing, kemudian direpresentasikan menggunakan TF-IDF dan diklasifikasikan menggunakan SVM dengan optimasi parameter melalui Grid Search. Evaluasi model dilakukan menggunakan Confusion Matrix untuk mengukur nilai akurasi, presisi, recall, dan f1-score. Hasil pengujian menunjukkan bahwa metode Soft Voting tanpa normalisasi menghasilkan akurasi tertinggi sebesar 75.39

URI
https://repo.itera.ac.id/depan/submission/SB2602130074

Keyword
Analisis Sentimen Pelabelan Leksikon Soft Voting Support Vector Machine DeepL Translator API