EVALUASI PERBANDINGAN METODE FASTTEXT DAN WORD2VEC PADA PENCARIAN FILE DI TELEGRAM BERBASIS BOT DENGAN PYROGRAM
Pertumbuhan aset digital menuntut sistem pencarian file yang efektif. Telegram berbasis cloud menawarkan penyimpanan gratis, namun fitur pencariannya belum mampu memanfaatkan hubungan semantik antar kata. Penelitian ini membandingkan model word2Vec dan fastText untuk pencarian file Telegram berbasis semantik menggunakan Cosine Similarity. Kinerja sistem dievaluasi berdasarkan confusion matrix, durasi pencarian, dan MAP@K. Hasil evaluasi menunjukkan bahwa Word2Vec dan fastText memiliki performa yang relatif kompetitif. word2Vec unggul pada sebagian besar metrik, yaitu precision (0,125), F1-score (0,136), durasi pencarian (67,851 ms), dan MAP@K (0,445), sedangkan fastText menunjukkan nilai recall rata-rata yang lebih tinggi (0,825). Secara umum, kedua model memiliki nilai precision dan F1-score di bawah 0,2 yang disebabkan oleh pembobotan kata yang seragam serta keterbatasan model pretrained dalam merepresentasikan semantik domain keislaman. Dari sisi efisiensi, fastText membutuhkan waktu pembuatan pretrained lebih dari 4 jam dan waktu pemuatan model yang lebih lama dibandingkan Word2Vec (86.110,29 ms) akibat penggunaan subword. Meskipun demikian, penerapan pencarian semantik berbasis bot Telegram meningkatkan performa pencarian dibandingkan fitur pencarian bawaan Telegram yang tidak mampu melakukan pencarian berbasis semantik (0 relevan).
Kata kunci : Information Retrival; Telegram; file; word2vec ; fastText
URI
https://repo.itera.ac.id/depan/submission/SB2602200137
Keyword
Information Retrival Telegram file word2vec fasttext