(0721) 8030188    pusat@itera.ac.id   

PERBANDINGAN LEMMATIZATION DAN STEMMING PADA PENILAIAN ESAI SINGKAT BERBAHASA INGGRIS MENGGUNAKAN TF-IDF DAN COSINE SIMILARITY


Di dunia pendidikan, dibutuhkan suatu evaluator otomatis untuk mengevaluasi soal esai agar penilaian konsisten dan cepat. Dalam proses pengembangannya, dapat digunakan 2 tahapan text-preprocessing yaitu lemmatization dan stemming. Belum banyak penelitian yang membandingkan kedua tahapan ini. Oleh sebab itu, tujuan penelitian ini adalah untuk mengetahui perbandingan tingkat akurasi penilaian esai singkat otomatis berbahasa Inggris menggunakan metode TF-IDF dan cosine similarity dengan penerapan proses lemmatization dan dengan penerapan proses stemming. Tahapan penelitian yaitu menyiapkan dataset berupa dokumen jawaban, dokumen kunci jawaban, serta nilai evaluasi manusia, Spelling correction, Case Folding, Tokenizing, Stopword Removal, Stemming, POS Tagging, Lemmatization. TF-IDF, Cosine Similarity, Scoring, dan Mean Absolute Error. Hasil penelitian menunjukkan nilai Mean Absolute Error (MAE) dari model yang menerapkan proses lemmatization sebesar 2,674 sedangkan untuk model yang menerapkan proses stemming mendapatkan nilai MAE yang sebesar 2,625. Dapat disimpulkan bahwa performa model dengan proses stemming lebih baik dibandingkan dengan model dengan proses lemmatization.

URI
https://repo.itera.ac.id/depan/submission/SB2305030001

Keyword