Klasifikasi multi-label terjemahan Al-Qur’an bahasa Indonesia menggunakan model Long Short-Term Memory

Abstract

ABSTRAK Salah satu ibadah yang paling dianjurkan dalam Islam adalah mempelajari Al-Qur'an. Ketika mempelajari Al-Quran, perlu dipahami bagaimana mengklasifikasikan ayat-ayatnya. Pengelompokkan dapat digunakan untuk mempelajari lebih lanjut suatu ayat dan mempermudah pencarian ayat-ayat yang terkait. Hal yang menarik dari penggolongan ayat-ayat dalam Al-Quran adalah setiap ayat dapat masuk dalam satu atau lebih kategori yang berbeda. Penelitian ini mengeksplorasi model deep learning untuk mengklasifikasikan isi terjemahan Al-Qur'an berbahasa Indonesia menjadi kategori-kategori inti seperti Tauhid, Ibadah, Akhlaq, dan Sejarah. Dengan memanfaatkan algoritma Long Short Term Memory (LSTM) dan Bi-LSTM serta word embedding Word2Vec dan FastText, penelitian ini membandingkan teknik-teknik tersebut untuk mengoptimalkan klasifikasi teks Al-Qur'an. Menggunakan dataset dari terjemahan Al-Qur'an juz 4 - 8, penelitian ini mengevaluasi pengaruh hyperparameter terhadap kinerja algoritma. Hasil menunjukkan bahwa kombinasi Bi-LSTM + FastText + Hyperparameter memberikan hasil terbaik dengan akurasi 71,63%, precision 64,06%, recall 63,60%, dan hamming loss 36,17%. Dengan penyetelan parameter terbaik, penelitian ini menawarkan solusi yang berpotensi untuk mengklasifikasikan ayat-ayat Al-Qur'an dalam bahasa Indonesia dengan tingkat akurasi yang baik. مستخلص البحث من أهم العبادات في الإسلام دراسة القرآن. عند دراسة القرآن لا بد من فهم كيفية تصنيف آياته. يمكن استخدام التجميع لمعرفة المزيد عن الآية وتسهيل العثور على الآيات ذات الصلة. والشيء المثير للاهتمام في تصنيف الآيات في القرآن هو أن كل آية يمكن أن تندرج تحت فئة واحدة أو أكثر. يستكشف هذا البحث نموذج التعلم العميق لتصنيف محتويات ترجمات القرآن الإندونيسي إلى فئات أساسية مثل التوحيد والعبادة والأخلاق والتاريخ. من خلال استخدام خوارزميات الذاكرة طويلة المدى (LSTM) وBi-LSTM بالإضافة إلى تضمين الكلمات Word2Vec وFastText، يقارن هذا البحث هذه التقنيات لتحسين تصنيف نص القرآن الكريم. باستخدام مجموعة بيانات من ترجمات الأجزاء 4 - 8 من القرآن الكريم، يقوم هذا البحث بتقييم تأثير المعلمات الفائقة على أداء الخوارزمية. أظهرت النتائج أن الجمع بين Bi-LSTM + FastText + Hyperparameter يوفر أفضل النتائج بدقة تبلغ 71.63%، ودقة 64.06%، واستدعاء 63.60%، وخسارة تشويش بنسبة 36.17%. ومن خلال تحديد أفضل المعايير، يقدم هذا البحث حلاً لديه القدرة على تصنيف آيات القرآن باللغة الإندونيسية بمستوى جيد من الدقة. ABSTRACT One of the most recommended acts of worship in Islam is studying the Qur'an. When studying the Quran, it is necessary to understand how to classify its verses. Classifying can be used to further study a verse and make it easier to find related verses. The interesting thing about classifying verses in the Quran is that each verse can fall into one or more different categories. This research explores a deep learning model to classify the content of Indonesian Qur'an translations into core categories such as Tawheed, Worship, Akhlaq, and History. By utilizing Long Short Term Memory (LSTM) and Bi-LSTM algorithms as well as Word2Vec and FastText word embedding, this study compares these techniques to optimize the classification of Qur'anic text. Using a dataset of Qur'anic translations of juz 4 - 8, this study evaluates the effect of hyperparameters on algorithm performance. The results show that the combination of Bi-LSTM + FastText + Hyperparameter gives the best results with 71.63% accuracy, 64.06% precision, 63.60% recall, and 36.17% hamming loss. With the best parameter tuning, this research offers a potential solution for classifying Qur'anic verses in Indonesian with a good level of accuracy

    Similar works