PERBANDINGAN KINERJA WORD2VEC DAN FASTTEXT DALAM PENILAIAN ESAI OTOMATIS PADA TEKS BAHASA INDONESIA
Penilaian esai memunculkan masalah bagi penilai yaitu dapat bersifat subjektif, inkonsisten dan membutuhkan waktu yang lama. Salah satu teknologi yang dapat membantu adalah penilaian esai otomatis, meskipun masih menghadapi hambatan dalam metode pembobotan kata yaitu belum mampu menangkap hubungan semantik (makna) antar kata. Perkembangan metode pembobotan kata yang dapat menangkap hubungan semantik kata yaitu Word2Vec dan fastText, dimana Word2Vec memproses data berdasarkan kata tanpa memperhatikan subkata, berbeda dengan fastText yang memperhatikan subkata dari sebuah kata. Penelitian ini bertujuan untuk mengetahui metode pembobotan kata terbaik antara keduanya dalam penilaian esai otomatis pada teks Bahasa Indonesia. Metodologi penelitian meliputi pengumpulan data esai dalam Bahasa Indonesia, text preprocessing, pembobotan kata, perhitungan similaritas dan pengujian kinerja model. Hasil penelitian menunjukkan bahwa kinerja Word2Vec lebih baik dibandingkan fastText baik dari aspek kecepatan waktu pemrosesan maupun akurasi, dengan nilai error terendah sebesar 23,670 pada dataset politik dan 22,006 pada dataset teknologi. Hal tersebut karena proses pemahaman kata pada kedua metode berbeda. Pemahaman subkata membuat data yang diproses lebih banyak, sehingga berbanding lurus dengan waktu yang diperlukan. Meskipun fastText memiliki kemampuan untuk menangani kata-kata yang jarang atau tidak terdapat dalam korpus pelatihan, Word2Vec memberikan korelasi yang lebih baik terhadap skor yang diberikan oleh penilai manusia dikarenakan pemahamannya terhadap hubungan antar kata secara lokal atau dengan kata sekitar lebih baik, dimana penilaian esai memerlukan pemahaman secara keseluruhan kata dalam sebuah jawaban.
URI
https://repo.itera.ac.id/depan/submission/SB2502040020
Keyword
Penilaian Esai Otomatis Word2Vec fastText