(0721) 8030188    [email protected]   

PERANCANGAN MODEL SOFTWARE ALGORITMA Q-LEARNING DAN INTERFACE OUTPUT PADA ARTIFICIAL INTELLIGENCE REINFORCEMENT ACCELERATOR (AIRA)


Artificial Intelligence Reinforcement Accelerator (AIRA) merupakan sistem hardware akselerator yang dirancang khusus untuk mengoptimalkan implementasi algoritma Q-learning dalam menyelesaikan permasalahan pathfinding pada lingkungan labirin dengan performa tinggi dan efisiensi energi. Q-learning merupakan metode reinforcement learning yang memungkinkan agen untuk belajar mencapai solusi optimal melalui interaksi dengan lingkungan tanpa model yang diketahui sebelumnya. Penelitian ini mengimplementasikan software Q-learning berbahasa Python yang dapat menangani labirin bervariasi (4×4, 8×8, 10×10, dan 16×16). AIRA dilengkapi interface output yang dirancang menggunakan Verilog HDL dengan visualisasi LED directional dan seven-segment display untuk menampilkan real-time navigation dan state transitions. Hasil implementasi menunjukkan pencapaian yang signifikan dimana Hardware AIRA mencapai kecepatan pemrosesan 14.37 ms untuk labirin 4×4, 147.7× lebih cepat dibandingkan PYNQ-Z2 (2.12 detik) dan 8.65× lebih cepat dibandingkan implementasi software Anaconda (0.124 detik). Dari segi efisiensi energi, sistem AIRA mengonsumsi daya hanya 1.42W, mencapai efisiensi 31.7× lebih baik dibandingkan laptop AMD Ryzen 7 4800H (45W) dan 3.5× lebih efisien dibandingkan PYNQ-Z2 Dual ARM Cortex-A9 MPCore (4.95W). Parameter optimal yang diidentifikasi adalah α=0.2-0.3, γ=0.9-0.95, ε=0.1-0.3, dan 1000 episode untuk keseimbangan optimal antara convergence speed dan computational efficiency. Validasi interface output menunjukkan sinkronisasi sempurna antara state machine, LED indicators, dan seven-segment display dalam menampilkan jalur navigasi optimal.

URI
https://repo.itera.ac.id/depan/submission/SB2508250011

Keyword
Q-learning Labirin Python Software Interface Output