9 research outputs found

    Spelling Checker using Algorithm Damerau Levenshtein Distance and Cosine Similarity

    Get PDF
    Writing is an embodiment of the author's ideas that are to be conveyed to others. A writer often experiences typos in typing the script, so that it can influence the meaning of the text. Therefore, a system is needed to detect word errors. In this study, checking is done by using the Dictionary Lookup method and giving the candidate words using the Damerau Levenshtein Distance algorithm. Candidates will then determine the ranking by breaking the word into Bigram form and calculating the similarity value using the Cosine Similarity algorithm. The test results based on the data used yield different Mean Reciprocal Rank (MRR) values for each type of error. The type of error deletion produces an MRR value of 88.89%, the type of insertion error produces an MRR value of 97.78%, the type of substitution error produces an MRR value of 88.89%, the type of transposition error produces an MRR value of 89

    DETEKSI KATA TAK BAKU DAN KESALAHAN PENULISAN KATA PADA TUGAS AKHIR MAHASISWA MENGGUNAKAN METODE DICTIONARY LOOKUP

    Get PDF
    Dictionary lookup merupakan sebuah metode pencarian sederhana yang bertujuan untuk menemukan kata di dalam sebuah kamus. Metode ini secara efektif dapat diimplementasikan untuk menemukan kesalahan penulisan kata berdasarkan sumber leksikal. Penelitian ini dilakukan untuk membangun sebuah sistem yang dapat mendeteksi kata yang tidak standar dan kesalahan penulisan kata dengan melakukan pencarian kata tersebut di dalam Kamus Besar Berbahasa Indonesia (KBBI) dan Kamus Kateglo. Selain itu, process pencarian kata di dalam kamus dioptimisasi dengan mengutilisasi index yang ada pada database. Validasi sistem dilakukan dengan membangun sistem antarmuka yang menampilan opsi kepada pengguna untuk mengunggah dokumennya. Sistem dievaluasi menggunakan 40 dokumen tugas akhir mahasiswa. Hasil uji menunjukkan bahwa rata-rata dokumen dapat diproses dengan kecepatan 187 kata tiap detik. Rata-rata kesalahan kata yang terdapat di setiap dokumen adalah 2,76% dengan nilai presisi adalah 28,71%. Nilai presisi yang rendah disebabkan oleh tingginya nilai False Positive yang ditentukan oleh tidak adanya kata tersebut di dalam kamus. Namun, sistem yang dibangun sudah memperoleh nilai True Negative yang tinggi sehingga akurasi juga menjadi tinggi

    NORMALISASI TEKS BERBAHASA MALAYSIA MENGGUNAKAN ALGORITMA JARO-WINKLER

    Get PDF
    Sebagian besar pengguna internet di Malaysia menggunakan media sosial untuk mendapatkan pembaruan informasi secara rutin. Namun, frekuensi penggunaan media sosial yang tinggi, tidak sebanding dengan ejaan kalimat tidak baku (informal) yang digunakan dalam mengisi konten media sosial dengan maksud untuk memudahkan komunikasi. Ejaan bahasa yang digunakan tidak hanya membingungkan pembaca media sosial namun juga mempengaruhi arti dari kata yang diketikan, normalisasi berguna untuk mengembalikan kata yang salah dalam pengetikan dan menggunakan metode pendekatan yaitu algortima Jaro-Winkler yang sesuai dalam membantu untuk menormalisasikan kata yang salah dalam pengetikan. Data yang digunakan pada penelitian ini berupa 719 data tweet dalam berbagai akun yang menggunakan bahasa Malaysia dan 34.727 kata dasar bahasa Malaysia. Pada penelitian ini didapatkan akurasi sebesar 76,85% dengan hasil telah dicocokan dengan validator

    PENGOREKSIAN EJAAN BAHASA MINANGKABAU MENGGUNAKAN LEVENSHTEIN DISTANCE

    Get PDF
    Kesalahan pada penulisan kerap terjadi ketika sedang chatting, berkomentar di Social Media. Kesalahan penulisan ini bermacam-macam bentuk yang sering di temui seperti, kesalahaan ejaan yang disengaja (penyingkatan), kesalahan ejaan yang tidak sengaja (typo), menggunakan kombinasi karakter huruf besar kecil ataupun angka, dan penggunaan tanda baca yang berlebihan. Sebagian orang tetap mampu memahami makna dari penulisan ejaan yang salah tersebut, namun juga ada orang yang tidak dapat mengerti bahkan salah pengertian terhadap kesalahan penulisan. Sistem pengoreksian ejaan mampu mengurangi tingkat kesalahan pada penulisan. Salah satu algoritma yang diterapkan pada penelitian ini adalah Levenshtein Distance. Algoritma tersebut memiliki 3 operasi yaitu penghapusan karakter, penambahan karakter dan perubahan karakter. Levenshtein distance digunakan untuk menghitung jarak antara 2 string yaitu kata target dan kata sumber. Semakin pendek jarak antara 2 string maka kata rekomendasi yang ditampikan cocok dengan kata sumber. Pada penelitian penulis mengambil data dari komentar Social Media Instagram akun @ota_lapau. Hasil dari penelitian yang telah dilakukan pada Bahasa Minangkabau dengan perhitungan akurasi menggunakan metode Suggestion Adequacy maka memperoleh akurasi sebesar 72.24%

    Satellite Workshop On Language, Artificial Intelligence and Computer Science for Natural Language Processing Applications (LAICS-NLP): Discovery of Meaning from Text

    Get PDF
    This paper proposes a novel method to disambiguate important words from a collection of documents. The hypothesis that underlies this approach is that there is a minimal set of senses that are significant in characterizing a context. We extend Yarowsky’s one sense per discourse [13] further to a collection of related documents rather than a single document. We perform distributed clustering on a set of features representing each of the top ten categories of documents in the Reuters-21578 dataset. Groups of terms that have a similar term distributional pattern across documents were identified. WordNet-based similarity measurement was then computed for terms within each cluster. An aggregation of the associations in WordNet that was employed to ascertain term similarity within clusters has provided a means of identifying clusters’ root senses

    24th Nordic Conference on Computational Linguistics (NoDaLiDa)

    Get PDF

    The Future of Information Sciences : INFuture2009 : Digital Resources and Knowledge Sharing

    Get PDF

    Factors Influencing Customer Satisfaction towards E-shopping in Malaysia

    Get PDF
    Online shopping or e-shopping has changed the world of business and quite a few people have decided to work with these features. What their primary concerns precisely and the responses from the globalisation are the competency of incorporation while doing their businesses. E-shopping has also increased substantially in Malaysia in recent years. The rapid increase in the e-commerce industry in Malaysia has created the demand to emphasize on how to increase customer satisfaction while operating in the e-retailing environment. It is very important that customers are satisfied with the website, or else, they would not return. Therefore, a crucial fact to look into is that companies must ensure that their customers are satisfied with their purchases that are really essential from the ecommerce’s point of view. With is in mind, this study aimed at investigating customer satisfaction towards e-shopping in Malaysia. A total of 400 questionnaires were distributed among students randomly selected from various public and private universities located within Klang valley area. Total 369 questionnaires were returned, out of which 341 questionnaires were found usable for further analysis. Finally, SEM was employed to test the hypotheses. This study found that customer satisfaction towards e-shopping in Malaysia is to a great extent influenced by ease of use, trust, design of the website, online security and e-service quality. Finally, recommendations and future study direction is provided. Keywords: E-shopping, Customer satisfaction, Trust, Online security, E-service quality, Malaysia
    corecore