(0721) 8030188    pusat@itera.ac.id   

KOMPARASI KINERJA FEATURE EXTRACTION TF-IDF DAN TF-IDF-DF UNTUK METODE SVM BERBASIS PSO PADA ANALISIS SENTIMEN UU TPKS


Tujuan penelitian: menghasilkan hasil kinerja feature extraction menggunakan TFIDF dan TF-IDF-DF serta mengetahui metode feature extraction terbaik dari perbandingan TF-IDF dan TF-IDF-DF pada analisis sentimen UU TPKS, menghasilkan dan mengetahui hasil evaluasi terbaik dari penggunaan feature extraction menggunakan TF-IDF dan TF-IDF-DF pada SVM berbasis PSO berdasarkan Accuracy, Recall dan Precision. Tahapan penelitian: pengumpulan data secara Crawling menggunakan API Twitter, pelabelan data menggunakan Vader Lexicon, pre-processing data (Cleansing Data, Case Folding, Tokenize, Normalisasi, Stopwords Removal, Lemmatization), feature extraction menggunakan TF-IDF dan TF-IDF-DF, splitting data (80%:20%), feature selection menggunakan PSO, klasifikasi menggunakan SVM, evaluasi model klasifikasi menggunakan Confusion Matrix. Hasil kinerja dari TF-IDF pada feature ‘act’ menghasilkan nilai sebesar 0.53 pada D13, 0.36 pada D15, 0.35 pada D16, 0.53 pada D17, 0.29 pada D18, 0.32 pada D19, 0.35 pada D20. Hasil kinerja dari TFIDF-DF pada feature ‘act’ menghasilkan nilai sebesar 0.24 pada D13, 0.13 pada D15, 0.13 pada D16, 0.24 pada D17, 0.13 pada D18, 0.13 pada D19, 0.13 pada D20. Hasil feature extraction menggunakan TF-IDF menghasilkan nilai yang lebih besar dari pada TF-IDF-DF. Nilai evaluasi dataset TF-IDF.csv menghasilkan nilai Accuracy sebesar 90.72%, Precision sebesar 90.73%, dan Recall sebesar 100%. Nilai evaluasi dataset TF-IDF-DF.csv menghasilkan Accuracy sebesar 87.62%, Precision sebesar 87.23%, dan Recall sebesar 100%. Dari perbandingan kedua nilai evaluasi diketahui bahwa nilai Accuracy, Recall dan Precision pada TF-IDF.csv lebih baik dari nilai evaluasi pada TF-IDF-DF.csv. Kata kunci: Analisis Sentimen, TF-IDF, TF-IDF, Particle Swarm Optimization, Support Vector Machine.

URI
https://repo.itera.ac.id/depan/submission/SB2301180141

Keyword