KLASIFIKASI BERITA BENCANA GEMPA TEKTONIK DI INDONESIA MENGGUNAKAN NAMED ENTITY RECOGNITION (NER) BERBASIS MULTINOMIAL NAIVE BAYES (MNB) PADA BERITA ONLINE KOMPAS
Analisis dampak bencana gempa tektonik dari berita online memerlukan pendekatan yang efisien untuk mengekstraksi dan mengklasifikasikan informasi penting. Penelitian ini bertujuan untuk menerapkan model Named Entity Recognition (NER) Rule-Based dan klasifikasi Multinomial Naive Bayes (MNB) dalam mengidentifikasi entitas dampak bencana pada berita media online kompas. Tahap awal dilakukan dengan menyusun kamus entitas dampak yang digunakan untuk mengekstrak istilah kunci seperti tewas, panik, trauma, kerusakan bangunan secara rule-based. Selanjutnya, fitur entitas yang diekstraksi dipresentasikan menggunakan metode Terms Frequency Inverse Document Frequency (TF-IDF) dengan pendekatan unigram dan bigram. Proses klasifikasi dilakukan menggunakan algoritma MNBuntuk mengelompokkan entitas ke dalam lima kategori dampak: ekonomi, kesehatan, sosial, lingkungan, dan tidak ada dampak. Hasil evaluasi menunjukkan bahwa model dengan TF-IDF unigram memberikan performa terbaik dengan akurasi mencapai 86%, serta F1-score tertinggi pada kelas "tidak ada" sebesar 95%, dan lingkungan sebesar 87%. Meskipun demikian performa untuk kelas sosial masih rendah dengan F1-score 60%, yang menunjukkan perlunya peningkatan dalam menangani variasi konteks sosial. Secara keseluruhan, penerapan NER rule-based dan MNB terbukti efektif dalam proses ekstraksi dan klasifikasi entitas dampak bencana dari berita online, serta dapat menjadi dasar bagi sistem pemantauan bencana secara otomatis dan cepat.
URI
https://repo.itera.ac.id/depan/submission/SB2509210042
Keyword
Multinomial Naive Bayes Berita Online Named Entity Recognition TF-IDF