(0721) 8030188    [email protected]   

PERANCANGAN MODUL REWARD DAN UPDATE TABEL Q PADA ARTIFICIAL INTELLIGENT REINFORCEMENT LEARNING (AIRA)


Reinforcement Learning (RL) merupakan salah satu metode pembelajaran mesin yang memungkinkan agen untuk belajar melalui interaksi dengan lingkungan, mengambil tindakan, dan menerima reward untuk mengoptimalkan kinerja dalam jangka panjang. Algoritma Q-learning merupakan pendekatan RL yang menggunakan Q-table untuk menyimpan nilai dari pasangan keadaan-aksi. Namun, implementasi berbasis perangkat lunak sering mengalami kendala ketika diterapkan pada sistem dengan ruang keadaan yang besar, sehingga diperlukan akselerasi perangkat keras. Penelitian ini bertujuan untuk merancang dan mengimplementasikan modul reward serta mekanisme pembaruan tabel Q pada sistem AIRA, sebuah model RL untuk navigasi labirin. FPGA digunakan sebagai akselerator untuk mempercepat proses pengambilan keputusan dan pembaruan nilai Q-table. Metode yang diterapkan meliputi pengembangan algoritma reward yang optimal, mekanisme pembaruan Q-table yang efisien, serta pengujian performa sistem dalam berbagai skenario labirin. Hasil pengujian menunjukkan bahwa sistem AIRA dengan akselerasi FPGA dapat meningkatkan efisiensi pembelajaran dan konvergensi nilai Q lebih cepat dibandingkan metode berbasis perangkat lunak. Dengan adanya optimasi pada modul reward dan pembaruan tabel Q, sistem mampu mengambil keputusan yang lebih akurat dalam navigasi labirin. Penelitian ini diharapkan dapat menjadi referensi dalam penerapan RL berbasis perangkat keras untuk berbagai aplikasi kecerdasan buatan yang membutuhkan pemrosesan real-time.

URI
https://repo.itera.ac.id/depan/submission/SB2508250014

Keyword
Reinforcement Learning Q-learning FPGA Q-Table Navigasi Labirin