EFEKTIVITAS PENGGUNAAN STOPLIST KATA UMUM DARI DOKUMEN HASIL KLASIFIKASI PRETOPOLOGY

Abstract

Dokumen teks bahasa Indonesia sangat melimpah dan setiap waktu bertambah. Dalam proses pencarian, banyak dokumen yang dihasilkan menjadi kurang relevan jika tidak sesuai dengan keinginan pengguna. Stoplist merupakan kumpulan kata yang “tidak relevanâ€, namun sering muncul dalam dokumen. Kata umum juga sering digunakan pada bidang tertentu sehingga dimungkinkan untuk dokumen sebidang akan ada kata umum yang sering muncul. Pada sistem temu kembali informasi, asumsi yang ada adalah dengan menghapus stoplist, maka mengurangi jumlah kata yang akan diproses. Adanya kata umum bidang, memungkinkan adanya mengurangan jumlah kata yang akan diproses juga. Dalam penelitian ini dilakukan ekstraksi kata umum dari dokumen hasil klasifikasi dan melakukan perbandingan efektifitas antara aplikasi pencarian-1 menggunakan penghapusan stoplist dengan aplikasi pencarian-2 menggunakan penghapusan stoplist dan kata umum. Hal ini dilakukan untuk mengetahui model pencarian dengan tingkat relevansi dan waktu proses pencarian dokumen yang lebih tinggi. Hasil uji coba klasifikasi pretopology dengan 25 dokumen teknik, 25 ekonomi dan 25 pertanian diperoleh nilai rata-rata recall dan precision sebesar 90% dan 76%. Dan uji coba pencarian dengan 6 query terhadap 746 dokumen pada aplikasi pencarian-1 diperoleh nilai rata-rata f-measure dan waktu proses adalah 30.6% dan 0.239 detik. Sedangkan aplikasi pencarian-2 dengan threshold kata umum 1% adalah 76.5% dan 0.098 detik. Sehingga dapat dikatakan bahwa aplikasi pencarian-2 (dengan menggunakan penghapusan stoplist dan kata umum) lebih efektif dari pada aplikasi pencarian-1.Kata kunci: Sistem temu kembali informasi, Stoplist, Klasifikasi Pretopology, Kata Umum

    Similar works