(0721) 8030188    pusat@itera.ac.id   

Analisis Metode Ward Pada Teknik Oversampling MWMOTE Dalam Upaya Penanggulangan Imbalance data Kualitas Air Tanah


Maraknya penggunaan internet dapat membuat jumlah data akan terus bertambah, sehingga diperlukan suatu proses yang dapat mempermudah pengolahan data dalam jumlah besar. Proses tersebut disebut dengan data mining, dimana dalam proses data mining terdapat sebuah metode bernama klasifikasi yang melakukan pengelompokan berdasarkan ciri-ciri tertentu terhadap sebuah data, buku, objek, atau benda-benda lainnya. Pada pengimplementasian metode klasifikasi, imbalance atau ketidakseimbangan data merupakan salah satu masalah yang terjadi karena adanya perbedaan jumlah data antara kelas mayoritas dan kelas minoritas. Permasalahan tersebut jika tidak diatasi dapat menyebabkan proses klasifikasi menghasilkan akurasi yang rendah terhadap kelas minoritas, dikarenakan pengklasifikasian tersebut lebih condong ke kelas mayoritas. Maka dari itu perlu dilakukannya penyeimbangan data dengan menerapkan metode oversampling yaitu MWMOTE Ward pada dataset utama yaitu Kualitas Air Tanah dan beberapa dataset pendukung (yeast, ecoli, diabetes, dan wine). Setelah dilakukannya proses oversampling, dataset akan memasuki proses klasifikasi dengan menggunakan algoritma Decision tree C4.5. Hasil evaluasi pada dataset utama menunjukan bahwa penerapan MWMOTE Ward menghasilkan performa yang sama dengan MWMOTE original, sehingga dapat dikatakan bahwa kedua metode tersebut memiliki performa yang baik dalam mengatasi permasalahan imbalance. Sedangkan pada dataset pendukung, MWMOTE Ward memperoleh rata-rata performa tertinggi yang dicapai yaitu accuracy 85.164%, precision 76.673%, recall 83.310%, dan f-measure 79.529%. Berdasarkan ke empat parameter itu, dapat disimpulkan bahwa MWMOTE Ward dapat dengan tepat menempatkan atau mengatur data dengan benar (sesuai kelas) berdasakan kepemilikan nilai atributnya.

URI
https://repo.itera.ac.id/depan/submission/SB2206080029

Keyword