(0721) 8030188    [email protected]   

All of ITERA Repository
Titles

PENERAPAN METODE BIOBERT UNTUK MENGKLASIFIKASIKAN ABSTRAK LITERATUR BIOMEDIS BERDASARKAN INTERAKSI ANTARA PROTEIN SARS-COV-2 DENGAN PROTEIN MANUSIA


View/Open

Author

Date Published
14 Jan 2026

Advisor
Luluk Muthoharoh, S.Si., M.Si.,
Ardika Satria, S.Si., M.Si.,

Subject
Sains Data

Publisher


Seiring meningkatnya jumlah publikasi biomedis pascapandemi SARS-CoV-2, dibutuhkan sistem otomatis yang mampu mengekstraksi dan mengklasifikasikan informasi secara efisien. Penelitian ini menerapkan model BioBERT untuk mengidentifikasi apakah suatu abstrak literatur biomedis membahas interaksi antara protein SARS-CoV-2 dan protein manusia menggunakan data abstrak dari PubMed. Proses dilakukan melalui dua tahap, yaitu Named Entity Recognition (NER) untuk mendeteksi entitas protein dan kata kunci interaksi, serta Relation Extraction (RE) untuk menentukan keberadaan hubungan interaksi. Pelatihan dilakukan menggunakan k-fold cross-validation dan berbagai kombinasi hyperparameter. Model NER mencapai hasil terbaik pada kombinasi hyperparameter max_len = 384, k-fold = 5, epoch = 10, batch size = 8, dan learning rate = 5 × 10⁻⁵, sedangkan model RE terbaik diperoleh dengan kombinasi hyperparameter max_len = 512, k-fold = 10, epoch = 10, batch size = 8, dan learning rate = 1 × 10⁻⁵. Evaluasi menunjukkan bahwa model NER menghasilkan loss 0,037, akurasi 0,925, precision 0,851, recall 0,878, dan F1 score 0,864, sementara model RE memperoleh akurasi 0,816, precision 0,835, recall 0,835, dan F1 score 0,835. Temuan ini menunjukkan bahwa BioBERT efektif dalam mengenali entitas biologis dan mengklasifikasikan interaksi protein berdasarkan abstrak biomedis, serta memiliki potensi kuat untuk mendukung ekstraksi pengetahuan biomedis skala besar secara otomatis.

URI
https://repo.itera.ac.id/depan/submission/SB2601210047

Keyword
BioBERT, Interaksi Protein, NER, RE, SARS-CoV-2