(0721) 8030188    [email protected]   

ANALISIS SENTIMEN ULASAN APLIKASI GETCONTACT MENGGUNAKAN RANDOM FOREST DENGAN EKSTRAKSI FITUR WORD2VEC


Kemajuan teknologi di era digital membawa dampak positif dan negatif, terutama dalam perlindungan data pribadi. Ancaman seperti panggilan spam dan phishing melalui SMS berpotensi mengganggu dan menyebabkan kerugian finansial. Untuk mengatasi masalah ini, Getverify LDA, perusahaan teknologi di Lisbon, Portugal, mengembangkan aplikasi Getcontact, yang berfungsi mengenali identitas penelepon dan melindungi pengguna dari spam dan phishing. Ulasan pengguna diperlukan untuk menilai efektivitasnya, sehingga analisis sentimen otomatis dibutuhkan untuk mengolah opini secara efisien. Penelitian ini menerapkan metode Random Forest dan Word2Vec dalam analisis sentimen ulasan aplikasi Getcontact. Word2Vec menghasilkan vektor kata dengan mempertimbangkan makna dan konteks untuk mengatasi kekurangan TF-IDF. Algoritma ini menggunakan dua pendekatan, CBOW untuk memprediksi kata dari konteks dan Skip-gram untuk memprediksi konteks dari kata. Random Forest dipilih karena unggul dalam meningkatkan akurasi, efisiensi penyimpanan data, dan seleksi fitur secara efektif. Tujuan penelitian ini adalah mengukur metrik evaluasi berupa akurasi, precision, recall, dan f1-score. Proses penelitian meliputi identifikasi masalah, studi literatur, pengumpulan dan pengolahan data melalui text pre-processing, ekstraksi fitur menggunakan Word2Vec, klasifikasi dengan Random Forest, dan evaluasi. Hasil menunjukkan akurasi tertinggi 85% pada rasio 90:10, recall stabil di 79-80%, presisi meningkat dari 81% ke 94%, dan F1-score naik dari 80% ke 86%. Penelitian ini dapat dikembangkan dengan mengeksplorasi metode lain atau menggabungkan beberapa metode, menggunakan dataset dengan topik berbeda, dan menganalisis kesalahan model untuk perbaikan lebih lanjut.

URI
https://repo.itera.ac.id/depan/submission/SB2502130060

Keyword
Getcontact Analisis Sentimen Random Forest Word2Vec Confusion Matrix