(0721) 8030188    pusat@itera.ac.id   

Klasifikasi dan Deteksi Lokasi Kasus Demam Berdarah di Indonesia Berdasarkan Tweet dengan Menggunakan Metode Naïve Bayes dan Named Entity Recognition


Demam berdarah merupakan penyakit yang berkembang di wilayah tropis menjadi salah satu penyakit yang sering terjadi di wilayah Indonesia dengan jumlah penderita yang banyak dan tersebar di seluruh Indonesia. oleh karena itu, dengan banyaknya penderita demam berdarah maka diperlukan sebuah informasi terkait lokasi kasus demam berdarah di Indonesia. Pada penelitian ini dilakukan klasifikasi kasus demam berdarah dengan skenario bentuk token unigram dan bentuk token bigram menggunakan metode Naive Bayes dan deteksi lokasi berdasarkan tweet dengan menggunakan metode NER. Penelitian ini dilakukan dengan membangun model klasifikasi kasus demam berdarah menggunakan metode Bernoulli Naive Bayes dengan data latih sebanyak 558 data dan model NER digunakan sebagai deteksi lokasi dibangun menggunakan arsitektur spaCy dengan data latih sebanyak 10480 data dan 10 kali iterasi. Dari hasil uji model klasifikasi dengan 186 data didapatkan hasil akurasi 89,78%, precision 93,49%, recall 91,26%, F1-score 92,36% pada bentuk token unigram sedangkan pada bentuk token bigram didapatkan hasil akurasi 52,68%, precision 89,58%, recall 34,12%, F1-score 49,41%. Dari hasil uji model NER untuk deteksi lokasi dengan 2273 data berentitas didapatkan hasil precision 79,2%, recall 74,2%, F1-score 76,6%. Kata Kunci : Klasifikasi Kasus Demam Berdarah, Deteksi Lokasi, Naive Bayes, NER

URI
https://repo.itera.ac.id/depan/submission/SB2106020020

Keyword