2 research outputs found

    Sundanese Stemming using Syllable Pattern

    Get PDF
    Stemming is a technique to return the word derivation to the root or base word. Stemming is widely used for data processing such as searching word indexes, translating, and information retrieval from a document in the database. In general, stemming uses a morphological pattern from a derived word to produce the original word or root word.  In the previous research, this technique faced over-stemming and under-stemming problems. In this study, the stemming process will be improved by the syllable pattern (canonical) based on the phonological rule in Sundanese. The stemming result for syllable patterns gets an accuracy of 89% and the execution of the test data resulted in 95% from all the basic words. This simple algorithm has the advantage of being able to adjust the position of the syllable pattern with the word to be stemmed. Due to some data shortage constraints (typo, loan-word, non-deterministic word with syllable pattern), we can improve to increase the accuracy such as adjusting words and adding reference dictionaries. In addition, this algorithm has a drawback that causes the execution to be over-stemming

    ALGORITMA STEMMING BAHASA ACEH MENGGUNAKAN BASIS ATURAN TATA BAHASA ACEH

    Get PDF
    Bahasa Aceh merupakan salah satu bahasa yang digunakan di provinsi Aceh khususnya daerah pesisir Aceh . Mempelajari bahasa Aceh dapat dilakukan dengan menggunakan kamus bahasa Aceh dengan cara menemukan arti kata berdasarkan urutan dikamus, namun dalam penggunaan bahasa Aceh ditemukan bahasa Aceh menggunakan imbuhan dalam penggunaannya, untuk membantu pelancong saat berada didaerah Aceh kata masukan dapat menggunakan algoritma stemming bahasa Aceh dan sebagai literatur stemming digital untuk bahasa Aceh, dengan menggunakan stemming kata berimbuhan dapat dipecah sehingga menjadi kata dasar dan dapat ditemukan pada kamus. Stemming algoritma bahasa Aceh memiliki akurasi 97,60% dengan menggunakan 502 kata dalam bahasa Aceh dengan aturan berdasarkan morfologi bahasa Aceh itu sendiri, dengan akurasi tersebut algoritma stemming bahas Aceh dapat digunakan dan berjalan dengan baik dilihat dari pengujian sistem, sedangkan pada pengujian menggunakan validator memiliki akurasi sebesar 93,20 dengan jumlah kata benar sebanyak 468 dari 502 kata uji. akurasi yang terjadi karena kurangnya kosakata pada kamus bahasa Aceh dan terjadinya overstemming dan understemming
    corecore