6 research outputs found
تعلم اللغة العربية بمساعدة الحاسب عن طريق الكلمات المتشابهة = Computer assisted language learning for Arabic using cognates
يتحدث الناس حول العالم بالعديد من اللغات المختلفة والتي تمتد بعض منها إلى مئات أو الآف السنين، ونشأت هذه اللغات بطرق مختلفة وانحدر بعض منها من لغات أخرى، ومع مرور الوقت توسع استخدام بعض هذه اللغات لتصبح لغات عالمية بينما تعرضت لغات أخرى إلى الاندثار. كما أن العديد من اللغات قد تعرضت للتحوير الذي يطرأ بشكل طبيعي على أي لغة مع مرور الوقت وبنفس الوقت تمت ولادة لغات جديدة من أعقاب لغات أخرى ولا شك ان هناك تشابهًا كبيرًا بين هذه اللغات الطبيعية، وتختلف نسبة التشابه ليشكل في بعض الأحيان ما يزيد عن نصف كلمات بعض اللغات والتي تعتبر مستلة من لغات أخرى. توسع استخدامات الحاسب الآلي في السنوات الماضية بشكل كبير حتى شملت استخداماته تعلم وتعليم اللغات الحية، ومن هذه اللغات حظيت اللغة الانجليزية بجانب كبير من هذا الاهتمام بينما لم تحظ اللغة العربية إلا على جانب قليل منه، وقد طورت في السنوات القليلة الماضية العديد من البرنامج والتطبيقات المستخدمة لتعليم اللغات ومنها اللغة العربية عن طريق الدروس والأمثلة والمسابقات والأسئلة والأجوبة والألعاب الحيوية التعليمية، بينما لا يوجد أي برنامج يقوم باكتشاف الكلمات المتشابهة في اللفظ والمعنى بين اللغة العربية واللغات الأخرىبشكل تلقائي ويستفيد من ذلك في تعليم اللغة، والتي تساعد هذه العملية على تسريع التعلم بشكل سهل وفعال وممتع، حيث ان المستخدم سيسهل عليه تذكر الكلمات ذات اللفظ المتشابه مع لغته الأم. يهدف هذا البحث إلى استخدام الحاسب وتقنية المعلومات لتسريع تعلم وتعليم اللغة العربية للمتحدثين بغيرها (اللغة الانجليزية أنموذجا في هذا البحث) وذلك عن طريق التركيز على الكلمات المتشابهة بين اللغة العربية واللغة الانجليزية، سيتمكن المتعلم عن طريق البرنامج من إنشاء وإضافة الدروس وسيتم استخراج الكلمات المتشابهة آلياً عن طريق الحاسب، سيتم استخدام المنهج التحليلي لدراسة وتحليل الطرق والخوارزميات المستخدمة لإيجاد التشابه بين اللغات المختلفة ومن ثم تطوير نظام لإيجاد التشابه بين اللغة العربية والانجليزية. وتعد هذه الأنظمة إحدى طرائق معالجة اللغات الطبيعية.
***** People around the world speak many different languages, some of
which extend back to hundreds or thousands of years, and these languages arose
in different ways and some of them descended from other languages. Many
languages have undergone modification that occurs naturally in any language
with time. At the same time, new languages were born from other languages,
and for sure there are large similarities between these languages, and the
similarity rate varies. Therefore, it sometimes can be more than half of the
language’s words, which are considered derived from other languages. The use
of computers in the past years has expanded greatly to be used in various
aspects of human life including learning and teaching living languages. Among
these languages, English language received a large part of this attention, while
the Arabic language received only a small part of it. In the past few years, many
programs and applications used to teach Languages, including the Arabic
language, through lessons, examples, competitions, questions and answers in
addition to educational games. While there is no program that detects words that
are similar in pronunciation and meaning between Arabic and other languages,
this process helps to accelerate learning in an easy, effective and enjoyable way.
Thus, the learner will find it easier for him to remember words with
pronunciation similar to his mother tongue. This research aims to use the
computer and information technology to accelerate the learning and teaching of
the Arabic language to non-native speakers (the English language is a model in
this research) by focusing on the similar words (cognates) between Arabic and
English, through the program, the learner will be able to create and add lessons,
then the cognates will be extracted automatically by computer. The analytical
approach will be used to study the methods and algorithms used to find
similarities between different languages, and then developing a new algorithm
to find similarities between Arabic and English languages, and this method is
considered one of the Natural Language Processing techniques
Bootstrapping a Stochastic Transducer for Arabic-English Transliteration Extraction
We propose a bootstrapping approach to training a memoriless stochastic transducer for the task of extracting transliterations from an English-Arabic bitext. The transducer learns its similarity metric from the data in the bitext, and thus can function directly on strings written in different writing scripts without any additional language knowledge. We show that this bootstrapped transducer performs as well or better than a model designed specifically to detect Arabic-English transliterations.
Bootstrapping a Stochastic Transducer for Arabic-English Transliteration Extraction
We propose a bootstrapping approach to training a memoriless stochastic transducer for the task of extracting transliterations from an English-Arabic bitext. The transducer learns its similarity metric from the data in the bitext, and thus can function directly on strings written in different writing scripts without any additional language knowledge. We show that this bootstrapped transducer performs as well or better than a model designed specifically to detect Arabic-English transliterations.
Recommended from our members
Using automatic speech recognition to evaluate Arabic to English transliteration
Increased travel and international communication has led to an increased need for transliteration of Arabic proper names for people, places, technical terms and organisations. There are a variety of available Arabic to English transliteration systems such as Unicode, the Buckwalter Arabic transliteration, and ArabTeX. The transliteration tables have been developed and used by researchers for many years, but there are only limited attempts to evaluate and compare different transliteration systems. This thesis investigates whether or not speech recognition technology could be used to evaluate different Arabic-English transliteration systems. In order to do so there were 5 main objectives: firstly, to investigate the possibility of using English speech recognition engines to recognize Arabic words; secondly, to establish the possibility of automatic transliteration of diacritised Arabic words for the purpose of creating a vocabulary for the speech recognition engine; thirdly, to explore the possibility of automatically generating transliterations of non diacritised Arabic words; fourthly to construct a general method to compare and evaluate different transliteration; and finally, to test the system and use it to experiment with new transliterations ideas
Applying dynamic Bayesian networks in transliteration detection and generation
Peter Nabende promoveert op methoden die programma’s voor automatisch vertalen kunnen verbeteren. Hij onderzocht twee systemen voor het genereren en vergelijken van transcripties: een DBN-model (Dynamische Bayesiaanse Netwerken) waarin Pair Hidden Markovmodellen zijn geïmplementeerd en een DBN-model dat op transductie is gebaseerd. Nabende onderzocht het effect van verschillende DBN-parameters op de kwaliteit van de geproduceerde transcripties. Voor de evaluatie van de DBN-modellen gebruikte hij standaard dataverzamelingen van elf taalparen: Engels-Arabisch, Engels-Bengaals, Engels-Chinees, Engels-Duits, Engels-Frans, Engels-Hindi, Engels-Kannada, Engels-Nederlands, Engels-Russisch, Engels-Tamil en Engels-Thai. Tijdens het onderzoek probeerde hij om verschillende modellen te combineren. Dat bleek een goed resultaat op te leveren