(0721) 8030188    [email protected]   

Analisis Pengaruh Hyperparameter Tuning Pada Model Klasifikasi Random Forest


View/Open

Author

Advisor
Winda Yulita, M.Cs.,

Koleksi
Teknik Informatika

Publisher


Di era Big Data, ketersediaan data dalam volume besar, kecepatan tinggi, dan ragam format menjadi tantangan sekaligus peluang dalam pengambilan keputusan berbasis data. Teknologi Machine Learning (ML) menjadi solusi kunci dalam mengekstraksi informasi dari data, salah satunya melalui algoritma Random Forest (RF) yang dikenal mampu menghasilkan prediksi akurat dan mengatasi overfitting pada Decision Tree. Meskipun demikian, performa RF sangat bergantung pada pemilihan parameter yang tepat. Oleh karena itu, penelitian ini bertujuan untuk mengevaluasi pengaruh metode Hyperparameter Tuning seperti Grid Search, Random Search, dan Bayesian Optimization, terhadap performa algoritma Random Forest pada sejumlah dataset klasifikasi yang beragam, dibandingkan dengan penggunaan parameter Default. Hasil penelitian menunjukkan bahwa Hyperparameter Tuning mampu meningkatkan metrik evaluasi seperti Accuracy, Precision, Recall, dan F1-score sebesar 1% hingga 4%, terutama pada dataset dengan pola yang kompleks seperti Heart Disease. Namun, peningkatan ini tidak signifikan secara keseluruhan, karena nilai Accuracy hasil Cross-Validation cenderung stagnan pada sebagian besar dataset. Temuan ini mengindikasikan bahwa efektivitas tuning sangat dipengaruhi oleh karakteristik dataset, seperti distribusi fitur dan tingkat noise. Pada dataset yang bersih dan terstruktur, seperti Air Quality, parameter default RF justru menghasilkan performa optimal tanpa perlu tuning tambahan. Selain itu, jika mempertimbangkan efisiensi waktu dan nilai Benefit Cost Ratio (BCR), Tuning dengan Hyperparameter Tuning cenderung memakan waktu lebih lama tanpa peningkatan performa yang sepadan. Dengan demikian, penggunaan parameter Default menjadi pilihan yang efisien dan layak untuk digunakan.

URI
https://repo.itera.ac.id/depan/submission/SB2507140018

Keyword
Random Forest Hyperparameter Tuning Grid Search Random Search Bayesian Optimization