(0721) 8030188    [email protected]   

EVALUASI PENERAPAN MAXIMUM MARGINAL RELEVANCE (MMR) DENGAN COSINE SIMILARITY DAN EUCLIDEAN DISTANCE PADA PERINGKASAN TEKS BERITA SECARA OTOMATIS


Kebutuhan akan akses informasi yang cepat mendorong pengembangan sistem peringkasan teks otomatis, terutama pada dokumen berita daring yang diproduksi dalam jumlah besar dan sering mengandung informasi berulang. Penelitian ini bertujuan untuk mengevaluasi penerapan pendekatan Maximum Marginal Relevance (MMR) dalam peringkasan teks otomatis dengan membandingkan dua pendekatan pengukuran kemiripan antar kalimat, yaitu Cosine Similarity dan Euclidean Distance. Proses penelitian mencakup preprocessing teks, pembobotan menggunakan TF-IDF, penghitungan kemiripan antar kalimat, dan penerapan MMR untuk pemilihan kalimat ringkasan. Dataset yang digunakan terdiri dari 100 teks berita berbahasa Indonesia dan ringkasan ahli dengan compression rate 30%. Evaluasi dilakukan menggunakan Confusion Matrix dan metrik pengukuran berupa Precision, Recall, serta F1-Score. Hasil evaluasi menunjukkan bahwa MMR dengan Euclidean Distance memberikan performa lebih baik dibandingkan dengan Cosine Similarity, dengan rata-rata Precision sebesar 55,08%, Recall 68,86%, dan F1-Score 60,70%. Sementara itu, Cosine Similarity menghasilkan Precision sebesar 52,20%, Recall 52,13%, dan F1-Score 51,65%. Temuan ini menunjukkan bahwa Euclidean Distance lebih efektif dalam mempertahankan informasi penting dari teks berita, sehingga direkomendasikan sebagai pendekatan yang lebih unggul dalam sistem peringkasan otomatis berbasis MMR.

URI
https://repo.itera.ac.id/depan/submission/SB2505220014

Keyword
Maximum Marginal Relevanve Cosine Similarity Euclidean Distance