Article thumbnail

Analisis Dan Implementasi Stemming Teks Berbahasa Indonesia Dengan Menggunakan Porter Stemmer

By NI NYOMAN BUDIASIH

Abstract

ABSTRAKSI: Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata dengan menghilangkan semua imbuhan. Berdasarkan asumsi bahwa term yang memiliki akar kata yang sama akan selalu memiliki makna yang sama, stemming digunakan pada information retrieval untuk meningkatkan keakuratan retrieval (perolehan informasi). Sehingga membuat penulis melakukan implementasi stemming teks berbahasa Indonesia pada information retrieval.Porter stemmer merupakan salah satu algoritma stemming yang telah lama digunakan. Porter Stemmer pertama kali dipublikasikan pada tahun 1980. Selain itu, Porter stemmer merupakan stemmer ini tidak menggunakan kamus, karena berdasarkan kenyataannya resource seperti kamus digital yang besar sangatlah mahalPada tugas akhir ini penulis mengimplementasikan Porter stemmer dan melakukan modifikasi pada Porter stemmer bila ditemukan stem yang tidak terdapat pada kamus yang digunakan. Setelah modifikasi, dilakukan perbandingan nilai keakuratan dari stem yang dihasilkan oleh Porter stemmer dan gabungan porter stemmer(stemmer hasil modifikasi Porter stemmer). Hasil dari pengujian menunjukkan bahwa stemming yang menggunakan gabungan porter stemmer menghasilkan keakuratan stem yang lebih baik dibandingkan dengan menggunakan Porter stemmer. Sehinggga dapat disimpulkan bahwa modifikasi yang dilakukan dapat meningkatkan keakuratan stem. Pada tugas akhir ini dilakukan pula analisis pengaruh proses stemming terhadap relevansi dokumen yang diretrieve pada Information Retrieval. Stemming dilakukan dengan Porter stemmer dan gabungan porter stemmer. Hasil penelitian menunjukkan bahwa peninggkatan keakuratan stem pada banyak kasus menurunkan nilai precision akan tetapi tidak akan berpengaruh terhadap nilai recall.Kata Kunci : Stemming, Information Retrieval, Precision, RecallABSTRACT: Stemming is the process of reducing morphological variants of a word to a common stem form. Stemming is a basic text processing tool often used for efficient and effective text retrieval, machine translation, document summarisation, and text classification. Based on assupmtion that term which have a common stem will usually have similar meaning, the stemming process is widely used in information retrieval as a way to improve retrieval performancePorter stemmer is well-known stemming algorithms that publicated in 1980. This stemming algorithm was developed without dictionary look-up. It based on the fact that resource such as a large digital dictionary are expensive. In this final paper, the modification will done if stem with Porter stemmer are not in dictionary. The accuracy of stem with Porter stemmer and Combination porter stemmer(modification of Porter stemmer) will be analyzed. The parameter that used are Stemming Weight and ratio between total of correct stem and total of stem. The result shows that accuracy with Combination porter stemmer better than porter stemmer.Besides that, the influence of accuracy stem in information retrieval was analyzed. In this case, parameter precision and recall are used to measure that influence. The result shows that accuracy of stem is might decreace precision and increase .recall.Keyword: Stemming, Information Retrieval, Precision, Recal

Topics: Sistem Komputer dan Jaringan Komputer
Publisher: Universitas Telkom
Year: 2009
OAI identifier: oai:openlibrary.telkomuniversity.ac.id:113078069
Provided by: Open Library

Suggested articles


To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.