KOMPARASI KINERJA FEATURE EXTRACTION TF-IDF DAN TF-IDF-DF UNTUK METODE SVM BERBASIS PSO PADA ANALISIS SENTIMEN UU TPKS
Tujuan penelitian: menghasilkan hasil kinerja feature extraction menggunakan TFIDF dan TF-IDF-DF serta mengetahui metode feature extraction terbaik dari
perbandingan TF-IDF dan TF-IDF-DF pada analisis sentimen UU TPKS,
menghasilkan dan mengetahui hasil evaluasi terbaik dari penggunaan feature
extraction menggunakan TF-IDF dan TF-IDF-DF pada SVM berbasis PSO
berdasarkan Accuracy, Recall dan Precision. Tahapan penelitian: pengumpulan
data secara Crawling menggunakan API Twitter, pelabelan data menggunakan
Vader Lexicon, pre-processing data (Cleansing Data, Case Folding, Tokenize,
Normalisasi, Stopwords Removal, Lemmatization), feature extraction
menggunakan TF-IDF dan TF-IDF-DF, splitting data (80%:20%), feature selection
menggunakan PSO, klasifikasi menggunakan SVM, evaluasi model klasifikasi
menggunakan Confusion Matrix. Hasil kinerja dari TF-IDF pada feature ‘act’
menghasilkan nilai sebesar 0.53 pada D13, 0.36 pada D15, 0.35 pada D16, 0.53
pada D17, 0.29 pada D18, 0.32 pada D19, 0.35 pada D20. Hasil kinerja dari TFIDF-DF pada feature ‘act’ menghasilkan nilai sebesar 0.24 pada D13, 0.13 pada
D15, 0.13 pada D16, 0.24 pada D17, 0.13 pada D18, 0.13 pada D19, 0.13 pada D20.
Hasil feature extraction menggunakan TF-IDF menghasilkan nilai yang lebih besar
dari pada TF-IDF-DF. Nilai evaluasi dataset TF-IDF.csv menghasilkan nilai
Accuracy sebesar 90.72%, Precision sebesar 90.73%, dan Recall sebesar 100%.
Nilai evaluasi dataset TF-IDF-DF.csv menghasilkan Accuracy sebesar 87.62%,
Precision sebesar 87.23%, dan Recall sebesar 100%. Dari perbandingan kedua nilai
evaluasi diketahui bahwa nilai Accuracy, Recall dan Precision pada TF-IDF.csv
lebih baik dari nilai evaluasi pada TF-IDF-DF.csv.
Kata kunci: Analisis Sentimen, TF-IDF, TF-IDF, Particle Swarm Optimization,
Support Vector Machine.
URI
https://repo.itera.ac.id/depan/submission/SB2301180141
Keyword