PERBANDINGAN KINERJA ANTARA METODE BILSTM DAN INDOBERT UNTUK KLASIFIKASI BERITA PALSU (HOAX) PADA BERITA BERBAHASA INDONESIA
Berita hoax merupakan informasi yang tidak benar atau tidak akurat yang disebarkan kepada publik dengan tujuan menyesatkan atau membentuk opini tertentu. Penyebaran hoax melalui platform digital berbahasa Indonesia semakin meningkat dan sulit dikendalikan secara manual. Oleh karena itu, diperlukan metode otomatis yang mampu mengklasifikasikan berita valid dan hoax secara akurat. Penelitian ini bertujuan untuk mengimplementasikan serta membandingkan performa dua metode deep learning, yaitu Bidirectional Long Short-Term Memory (BiLSTM) berbasis Word2Vec dan IndoBERT berbasis arsitektur Transformer. Dataset yang digunakan berjumlah 20.298 data berita yang terdiri atas 10.150 berita valid dan 10.148 berita hoax yang diperoleh dari Kaggle. Tahap prapemrosesan meliputi case folding, pembersihan teks, tokenisasi, dan stemming menggunakan Sastrawi. Evaluasi dilakukan dengan metode Stratified K-Fold Cross Validation (k=5) untuk menjaga keseimbangan distribusi kelas pada setiap fold. Metrik evaluasi yang digunakan meliputi accuracy, precision, recall, dan f1-score. Hasil eksperimen menunjukkan bahwa pada kombinasi hyperparameter terbaik, BiLSTM memperoleh accuracy dan f1-score sebesar 98,38%, sedangkan IndoBERT mencapai 99,73%. Pada kombinasi hyperparameter paling stabil, BiLSTM memperoleh accuracy sebesar 97,95%, sementara IndoBERT mencapai 99,46% pada seluruh metrik evaluasi data uji. Secara keseluruhan, IndoBERT menunjukkan performa yang lebih tinggi, stabil, dan memiliki kemampuan generalisasi yang lebih baik dibandingkan BiLSTM. Oleh karena itu, IndoBERT lebih direkomendasikan untuk klasifikasi berita hoax berbahasa Indonesia.
URI
https://repo.itera.ac.id/depan/submission/SB2606240234
Keyword
Berita Hoax Klasifikasi Teks Bidirectional LSTM IndoBERT Natural Language Processing Deep Learning