NORMALISASI TEKS BAHASA MAKASSAR MENGGUNAKAN DAMERAU LEVENSHTEIN

Abstract

Etnik Makassar memiliki bahasa sendiri yang disebut bahasa Makassar. Fonem bahasa Makassar sebanyak 23 buah (18 konsonan dan 5 vokal), Seringnya terjadi kesalahan dalam penulisan (Typo) yang menyebabkan kata-kata tersebut sulit dimengerti, tidak dimengerti atau bahkan terjadi perubahan makna dari kata tersebut. Berdasarkan masalah di atas, maka diperlukan normalisasi supaya memperbaiki kesalahan penulisan bahasa Makassar sehingga mudah dipahami dan dapat dimengerti oleh pembaca serta mengurangi kesalahpahaman bagi orang di luar masyarakat Makassar yang mau belajar atau baru belajar bahasa Makassar. Pada penelitian ini, konsep yang digunakan adalah metode Damerau Levenstein Distance. Stemming yang digunakan dari penelitian Saharuddin dengan judul Stemming bahasa Makassar berbasis morfologi tahun 2019. Data yang diambil berasal dari komentar di Youtube yang berjumlah 400 data dari berbagai komentar yang menggunakan Bahasa Makassar. Hasil pengujian dengan menggunakan rumus suggestion adequacy yang didapatkan pada penelitian ini memiliki rata-rata sebesar 72,22%. Kata kunci: Normalisasi, Damerau Levenstein, Bahasa Makassar

    Similar works