(0721) 8030188    pusat@itera.ac.id   

EKSTRAKSI DAN KLASIFIKASI KATA DASAR DARI DOKUMEN BERBAHASA BATAK TOBA DENGAN ALGORITMA PORTER STEMMER DAN LIKELIHOOD


Penelitian ini bertujuan mengatasi minimnya akses sumber literasi budaya lokal, khususnya Bahasa Batak Toba, dengan teknologi informasi. Fokusnya adalah pelestarian budaya Batak Toba di Sumatera Utara, Indonesia, di tengah penggeseran teknologi terhadap penggunaan bahasa lokal. Tantangan utamanya adalah kurangnya platform digital untuk bahasa Batak Toba. Penelitian sebelumnya menggunakan algoritma Porter Stemmer untuk ekstraksi kata dasar, namun masih ada kekurangan. Penelitian ini mengusulkan ekstraksi kata dasar dan pengklasifikasian menggunakan algoritma Porter Stemmer dan likelihood. Tahapannya meliputi identifikasi masalah, studi literatur, pengumpulan data, pengembangan sistem, pengujian, dan evaluasi. Sistem dikembangkan menggunakan PHP dan MySQL, diuji dengan black box testing. Hasilnya menunjukkan sistem berjalan dengan baik. Algoritma Porter Stemming mampu mengidentifikasi kata dasar dengan baik, sedangkan algoritma likelihood mencapai akurasi 100%. Evaluasi menunjukkan sistem memenuhi harapan, namun perbaikan perlu dilakukan, seperti membatasi proses stemming hanya pada kata-kata dalam kamus data dan meningkatkan modul perhitungan likelihood. Kesimpulannya, penerapan algoritma Porter Stemmer berhasil menampilkan kata dasar dan definisi dari kata, dengan akurasi perhitungan likelihood mencapai 100%. Namun, perbaikan diperlukan untuk meningkatkan kinerja sistem, khususnya dalam proses stemming dan perhitungan likelihood

URI
https://repo.itera.ac.id/depan/submission/SB2406050085

Keyword
Extraction and classification, Porter Stemming, Li