Penerapan Weighted Word Embedding pada Pengklasifikasian Teks Berbasis Recurrent Neural Network untuk Layanan Pengaduan Perusahaan Transportasi

Abstract

Twitter menjadi salah satu media sosial yang paling sering dan paling populer digunakan oleh perusahaan sebagai penyedia layanan pelanggan perusahaan. Adanya ribuan cuitan yang dapat masuk dalam setiap hari, tentu akan merepotkan operator layanan untuk mengkategorikan jenis berbagai cuitan tersebut, lebih-lebih jika proses pemilahan kategori cuitan harus dilakukan secara manual. Dalam Tugas Akhir ini, kategoriasi cuitan secara otomatis dibangun dan diimplementasiยฌkan menggunakan model klasifikasi berbasis recurrent neural network (RNN) yang dikombinasikan dengan model weighted word embedding (WWE). RNN merupakan salah satu jenis jaringan syaraf tiruan yang populer dan banyak digunakan dalam persoalan klasifikasi, sedangkan WWE merupakan metode yang memungkinkan untuk meng-hubungkan kata-kata yang serupa dengan mengukur jarak semantik antara vektor yang disematkan pada kata tersebut dan memberikan bobot yang berbeda pada setiap kata pada suatu kelas tertentu. Implementasi model penggabungan RNN dan WWE diuji coba menggunakan data pengaduan di perusahaan transportasi untuk data cuitan pada tahun 2015-2016. Hasil uji coba menunjukkan bahwa implementasi WWE baik yang menggunakan model FastText (Weighted FastText) maupun model Word2Vec (Weighted Word2Vec) memberikan hasil yang lebih baik dibandingkan dengan hasil kinerja yang menggabungkan RNN dan model word embedding biasa. Dengan menggunakan metode evaluasi berbasis 10-fold cross validation, model gabungan RNN-Weighted FastText dan RNN-Weighted Word2Vec berturut-turut memberikan hasil akurasi sebesar 88,2% dan 87,5%. Di lain pihak, dengan menggunakan metode evaluasi yang sama, model gabungan RNN-FastText dan RNN-Word2Vec memberikan hasil akurasi yang sama sebesar 83,4%

    Similar works