(0721) 8030188    pusat@itera.ac.id   

IMAGE TO TEXT MENGGUNAKAN INPUT KAMERA MOBILE DENGAN METODE LONG SHORT TERM MEMORY


Kecenderungan menggunakan aplikasi mobile berbasis Android dalam berbagai bidang menjadikannya memiliki perkembangan yang begitu cepat. Serta, demi pemenuhan kebutuhan pengguna, maka dikembangkan aplikasi dengan tujuan yang umum hingga khusus. Salah satunya, aplikasi pengenalan karakter atau Optical Character Recognition (OCR), yaitu aplikasi dengan kemampuan untuk menerima data citra dan mengenali karakter yang terkandung di dalamnya. Penerapan salah satu dari metode jaringan saraf berulang (RNN) akan menjadikan aplikasi tersebut menjadi lebih akurat, seperti Long Short Term Memory networks (LSTM). LSTM merupakan jaringan saraf berulang buatan (RNN) yang digunakan dalam bidang pembelajaran mendalam. Tidak seperti jaringan neural feedforward standar, LSTM memiliki koneksi umpan balik. Penelitian ini menerapkan LSTM yang terdapat pada Tesseract4Android dalam meningkatkan performa dan akurasi pada aplikasi OCR berbasis Android, di mana citra diambil langsung dari kamera mobile. Eksperimen model dengan 15000 data citra menghasilkan akurasi 97,5% pada font Helvetica, 90% pada font Calibri, 87,5% pada font Times New Roman. Eksperimen aplikasi dihasilkan pada font Helvetica sebanyak 13 unik karakter terdeteksi salah yaitu [B, D, I, O, a, g, i, l, p, q, 0, 1, 8]. Font Calibri sebanyak 6 unik karakter terdeteksi salah yaitu [I, l, o, r, 0, 1]. Font Times New Roman sebanyak 10 unik karakter terdeteksi salah yaitu [D, I, O, a, g, i, n, p, 0, 1]. Kata kunci: Optical Character Recognition(OCR), Long Short Term Memory (LSTM), Aplikasi Android.

URI
https://repo.itera.ac.id/depan/submission/SB2106070024

Keyword