(0721) 8030188    pusat@itera.ac.id   

Klasifikasi Sentimen Twitter Berbasis Target Menggunakan Long Short Term Memory dan Attention Network


Klasifikasi sentimen berbasis target bertujuan untuk mengidentifikasi polaritas sentimen suatu target tertentu dalam konteksnya. Penelitian sebelumnya sudah menyadari pentingnya target dalam klasifikasi sentimen. Namun, penelitian sebelumnya mengabaikan pemodelan target yang terpisah. Dalam tugas akhir ini diteliti apakah dengan menggunakan arsitektur Interactive Attention Network (IAN) yang memodelkan target dan konteks secara terpisah dan secara interaktif mempelajari attention dari target dan konteks dapat memprediksi polaritas sentimen berbasis target pada dataset twitter dan membuktikan pentingnya koordinasi target dan konteks untuk meningkatkan kinerja klasifikasi sentimen berbasis target. Setiap kalimat pada data twitter diberikan indeks kata dan direpresentasikan embedding pada setiap kata menggunakan GloVe. Setelah itu dibangkingkan hidden states dari tiap target dan konteks untuk selanjutnya digunakan dalam pembangkitan attention masing-masing. Penelitian ini mendapatkan model terbaik dengan nilai akurasi 0.708 dan macro-f1 0.686 yang didapatkan dari arsitektur IAN menggunakan model LSTM dengan pooling function average, batch size 32, menggunakan optimizer adam, dropout rate diatur dengan nilai 0.5, dimensi dari word embedding, attention vector dan LSTM hidden states diatur dengan nilai 300 dan menggunakan fix embedding. Pentingnya koordinasi target dan konteks juga terlihat dengan membandingkan nilai akurasi dan macro-f1 dengan arsitektur-arsitektur yang tidak memperhatikan koordinasi target dan konteks. Dalam penelitian selanjutnya dapat dilakukan modifikasi koordinasi target dengan menggunakan konteks dari kiri target dan konteks dari kanan target untuk meningkatkan performa model, menambahkan korelasi antara target dan konteks, mencoba pre-trained word embedding lain, eksplorasi tahapan preprocessing lain dan mencoba untuk menerapkan arsitektur IAN pada data twitter berbahasa Indonesia.

URI
https://repo.itera.ac.id/depan/submission/SB2009080001

Keyword