(0721) 8030188    pusat@itera.ac.id   

KOMPARASI METODE NAÏVE BAYES DAN RANDOM FOREST DECISION TREE DALAM KLASIFIKASI MULTI CLASS UJARAN KEBENCIAN TOPIK LGBT PADA TWITTER BERBAHASA INDONESIA


Pada Twitter, pengguna melakukan komunikasi antar sesama pengguna melalui komentar-komentar yang disebarkan dan dapat dikelompokkan menjadi dua tipe yaitu komentar terindikasi positif dan komentar yang terindikasi negatif. Pada komentar terindikasi negatif dapat menyebabkan masalah karena pada dasarnya terkandung unsur ujaran kebencian yang dapat mengakibatkan sanksi hukum bagi penulisnya. Pada penelitian dilakukan pendekatan dengan dua metode klasifikasi berupa Naïve Bayes dan Random Forest Decision Tree dalam proses klasifikasi multi class ujaran kebencian terkait topik LGBT pada Twitter berbahasa Indonesia. Penelitian berfokus pada penemuan metode klasifikasi mana yang mampu menghasilkan nilai akurasi komputasi terbaik. Proses klasifikasi diawali dengan perumusan masalah, studi literatur, pengumpulan data, labelling dan validasi label, preprocessing data terdiri dari beberapa sub-tahapan yaitu data cleaning, case folding, data normalization, tokenization, stopwords removal, stemming, tahapan selanjutnya pembobotan TF-IDF, klasifikasi metode Naïve Bayes dan Random Forest Decision Tree, evaluasi confusion matrix, serta analisis pembahasan dan hasil penelitian. Naïve Bayes memanfaatkan empat parameter yaitu alpha, force_alpha, fit_prior dan class_prior. Random Forest Decision Tree memanfaatkan parameter max_depth. Hasil evaluasi menggunakan confusion matrix memperlihatkan bahwa metode Naïve Bayes menghasilkan akurasi yang lebih baik yaitu accuracy 66%, precision 65%, dan recall 65%, jika dibandingkan dengan Random Forest Decision Tree memiliki accuracy 60%, precision 64%, dan recall 60%. Dari hasil evaluasi kedua metode, algoritma Naïve Bayes sedikit lebih baik dalam klasifikasi multi class ujaran kebencian Twitter.

URI
https://repo.itera.ac.id/depan/submission/SB2307020001

Keyword