(0721) 8030188    pusat@itera.ac.id   

PERBANDINGAN METODE LEMMATIZATION DAN STEMMING TERHADAP PENILAIAN JAWABAN PENDEK OTOMATIS MENGGUNAKAN TF-IDF DAN COSINE SIMILARITY TEKS BAHASA INDONESIA


Model penilaian jawaban pendek otomatis menggunakan TF-IDF dan Cosine Similarity membantu pengajar mengurangi inkonsistensi dan subjektifitas saat mengoreksi banyak ujian dalam waktu singkat. Metode TF-IDF memberikan efisiensi tinggi dalam mencocokkan kata pada dokumen Jawaban Siswa dengan Jawaban Guru, tetapi memiliki batasan seperti semakin banyak variansi corpus pada kedua dokumen, maka semakin lama waktu proses yang dibutuhkan. Tahap pre-processing berperan penting dalam mengurangi variansi bentuk kata dan kata yang tidak terlalu bermakna seperti kata "adalah" atau "yang". Normalisasi kata dapat dilakukan menggunakan metode stemming dan lemmatization, dimana stemming adalah proses untuk memetakan bentuk varian kata dengan memotong imbuhan yang terdapat pada kata untuk mendapatkan kata dasarnya, namun pemotongan imbuhan memungkinkan kata yang dihasilkan bukan merupakan kata dasarnya, melainkan hanya merepresentasikan bentuk yang sama. Sedangkan, lemmatization sendiri adalah salah satu proses dalam tahap pre-processing untuk memperoleh kata dasar sesuai dengan konteks sehingga hasil dari lemmatization pasti merupakan bentuk kata dasarnya. Penelitian ini dilakukan untuk mengetahui performa dan akurasi penilaian jawaban pendek otomatis menggunakan metode Cosine Similarity dan TF-IDF tanpa menggunakan pre-processing, dengan penerapan lemmatization, dan dengan penerapan stemming pada data teks berbahasa Indonesia. Hasil penelitian menunjukkan bahwa metode stemming memiliki nilai error terendah sebesar 13,32, sedangkan metode lemmatization memiliki nilai error sedikit lebih besar dengan angka 13,67. Model penilaian jawaban pendek otomatis tanpa penerapan tahap pre-processing memiliki nilai error terbesar sebesar 22,2. Hal tersebut menunjukkan bahwa tahap pre-processing menggunakan metode stemming dapat membantu meningkatkan performa dan akurasi dalam penilaian jawaban pendek otomatis.

URI
https://repo.itera.ac.id/depan/submission/SB2305310035

Keyword