(0721) 8030188    pusat@itera.ac.id   

EVALUASI RANDOM UNDERSAMPLING DAN MAJORITY WEIGHTED MINORITY OVERSAMPLING TECHNIQUE DALAM MENGATASI IMBALANCED DATASET


Klasifikasi merupakan model dalam melakukan prediksi berdasarkan dari suatu data yang sudah ada. Ketidakseimbangan data mengakibatkan misclassified atau kesalahan pemodelan dimana data tidak relevan dan menghasilkan pemodelan klasifikasi yang buruk. Model pengklasifikasian yang buruk diakibatkan karena adanya ketidakseimbangan data pada label klasifikasi, perlu adanya penyeimbangan data sebagai solusi dalam menyelesaikan permasalahan tersebut. Metode yang digunakan dalam menangani data imbalance yaitu Random Undersampling dan Majority Weighted Minority Oversampling Technique (MWMOTE). Tujuannya untuk melihat penerapan metode Random Undersampling dan Majority Weighted Minority Oversampling Technique (MWMOTE) berjalan dengan baik dalam mengatasi imbalanced dataset dan mengetahui kinerja serta akurasi dalam pemodelan. Dataset yang digunakan merupakan dataset open source dari Kaggle yaitu terdiri dari data Diabetes, data Bank Turnover, data Stroke, dan data Credit Card yang memiliki beragam rasio data dengan tujuan untuk menangani persamasalahan data tidak seimbang. Uji evaluasi model dengan menggunakan confusion matrix dan algoritma decision tree dengan melihat nilai precision, recall, f-measure, dan accuracy dari metode Random Undersampling dan Majority Weighted Minority Oversampling Technique (MWMOTE). Random Undersampling dapat mengatasi permasalahan data tidak seimbang dengan nilai precision 76,28%, recall 76,74%, f-measure 76,48%, dan accuracy 76,21%. MWMOTE dapat mengatasi permasalahan data tidak seimbang dengan nilai precision 86,04%, recall 87,30%, f-measure 86,66%, dan accuracy 86,61%. Dapat disimpulkan bahwa metode Majority Weighted Minority Oversampling Technique (MWMOTE) lebih baik dari pada metode Random Undersampling dikarenakan hasil evaluasi confusion matrix rata rata metode Random Undersamplin lebih kecil dari pada metode Majority Weighted Minority Oversampling Technique (MWMOTE).

URI
https://repo.itera.ac.id/depan/submission/SB2304120008

Keyword