Identifikasi penyakit paru-paru berdasarkan suara dan riwayat pasien menggunakan model Cross-Attention Video Vision Transformer
Identifikasi penyakit paru-paru dapat dilakukan melalui analisis suara batuk dan riwayat pasien. Penelitian ini mengembangkan model berbasis Cross-Attention Video Vision Transformer yang memanfaatkan representasi fitur audio dan data riwayat pasien untuk klasifikasi penyakit paru-paru. Mel Frequency Cepstral Coefficient(MFCC) digunakan untuk ekstraksi fitur audio, sementara fitur riwayat pasien memperkaya informasi tanpa menambah beban komputasi. Dataset yang digunakan terdiri dari suara batuk, data riwayat pasien, dan label penyakit dengan tiga kelas: asma, COPD, dan sehat. ModelVideo Vision Transformer diterapkan dengan embedding spasial dan
temporal, dioptimalkan melalui mekanisme Cross-Attention. Evaluasi dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score, serta analisis kurva ROC-AUC untuk memeriksa performa klasifikasi antar kelas. Hasil penelitian menunjukkan bahwa model mampu mencapai akurasi terbaik sebesar 82.57
URI
https://repo.itera.ac.id/depan/submission/SB2507230029
Keyword
Cross-Attention Identifikasi penyakit paru-paru klasifikasi suara MFCC Video Vision Transformer