(0721) 8030188    pusat@itera.ac.id   

STUDI PENGARUH TEKNIK SAMPLING PADA DATA TAK SEIMBANG


Salah satu masalah yang sering ditemukan dalam proses klasifikasi adalah data tak seimbang di mana distribusi data yang tidak merata antara kelas target yang dapat mengakibatkan terjadinya misclassification. Salah satu cara untuk mengatasi masalah data tak seimbang adalah dengan menggunakan metode pendekatan level data di mana data akan dimanipulasi agar distribusi data menjadi seimbang. Teknik sampling merupakan salah satu metode pendekatan level data yang terbagi menjadi Oversampling dan Undersampling. Pada penelitian ini akan membandingkan akurasi teknik sampling ROS, SMOTE, MWMOTE, RUS dan percobaan tanpa teknik sampling dengan algoritma klasifikasi CBA dan Random forest. Akurasi yang akan menjadi parameter perbandingan adalah akurasi terhadap data minoritas dan akurasi terhadap data mayoritas. Hasil perbandingan dari akurasi data minoritas dan akurasi data mayoritas dari setiap percobaan menunjukkan jika data tak seimbang perlu ditangani, di mana tanpa teknik sampling data minoritas tidak dapat diprediksi. Sedangkan dengan teknik sampling akurasi data minoritas meningkat. Kata Kunci: data tak seimbang, klasifikasi, teknik sampling, ROS, SMOTE, MWMOTE, RUS

URI
https://repo.itera.ac.id/depan/submission/SB2206080019

Keyword