PENANGANAN IMBALANCE DATA DENGAN DBSCAN PADA MWMOTE
Masalah terkait data sangat erat dengan Data Mining, salah satunya adalah data imbalance. Data yang tidak seimbang dapat mengurangi kualitas informasi yang disampaikan. Selain itu, noise dalam data juga mempengaruhi proses klasifikasi. Untuk mengatasi data imbalance, dapat digunakan teknik resampling, yaitupembuatansampelbarudari data yang ada. Ada dua jenis resampling, yaitu oversampling dan undersampling. MWMOTE (Majority Weighted Minority Oversampling Technique) adalahmetode oversampling yang membuat data sintesis berdasarkan kelas minoritas yang berdekatandengankelasmayoritas. Proses MWMOTE terdiridaritigafase: mengidentifikasikelaslangka dan kelas mayoritas, melakukan pembobotan pada kelas langka, dan menggunakan clustering untuk mengurangi noise. Salah satu teknik clustering yang digunakan adalah DBSCAN (Density-Based Spatial Clustering of Applications with Noise), yang mengelompokkan daerah dengan densitastinggi dan menganggapdaerahdengandensitasrendahsebagai noise.Penelitianinimemperolehpengurangan accuracy pada tahapimplementasi MWMOTE sebesar 1,22% pada dataset stroke dan pada data diabetes sebesar 2,22% sedangkanuntuknilai lain sepertiprecision, recall, f1-scoremengalamikenaikan yang signifikan pada tahapimplementasi MWMOTE + DBSCAN didapatkenaikan pada dataset stroke dan juga bank turnover dimanakeduadataetmendapatnilai 100% sedangkan pada dataset diabetes mengalami kenaikan accuracy dari 70,03% menjadi 72,66% kemudian nilaiprecision dari 69,33% menjadi 71,51% lalu recall dari 70,7% menjadi 75,33
URI
https://repo.itera.ac.id/depan/submission/SB2502140012
Keyword
Imbalance Data Noise Oversampling MWMOTE DBSCAN