PENERAPAN ALGORITME RABIN-KARP DAN COSINE
SIMILARITY UNTUK PEMERIKSAAN KESAMAAN
DOKUMEN TUGAS MAKALAH MAHASISWA
(STUDI KASUS: TEKNIK INFORMATIKA UIN SUSKA RIAU)
Kesamaan dokumen (document similarity) merupakan fondasi dari sistem kecerdasan dalam
pemrosesan data seperti information retrieval dan klasifikasi teks. Berdasarkan hasil wawancara
yang dilakukan terhadap beberapa dosen Teknik Informatika UIN SUSKA Riau, didapatkan bahwa
masih banyak ditemukan kasus kesamaaan dokumen tugas makalah antara satu mahasiswa dengan
mahasiswa lain, sehingga perlu dilakukan proses pemeriksaan kesamaan dokumen tugas makalah
mahasiswa. Pada penelitian ini, algoritme yang diterapkan untuk melakukan proses pemeriksaan
kesamaan dokumen adalah algoritme Rabin-Karp dan Cosine Similarity. Algoritme Rabin-Karp
digunakan untuk proses prepocessing dan ekstraksi nilai hash. Sedangkan Cosine similarity
digunakan untuk menghitung nilai persentase kesamaan dari dokumen yang diuji. Hasil pengujian
tata letak kalimat didapatkan bahwa nilai similarity akan tetap sama walaupun letak kalimat telah
diubah. Selanjutnya, hasil pengujian dokumen yang sama akan menghasilkan presentase similarity
100%. Sebaliknya, hasil pengujian dokumen yang tidak sama akan menghasilkan presentase
similarity 0%. Selain itu pengujian dua dokumen dengan nilai K yang digunakan 3, 5, 6, dan 7
diperoleh hasil bahwa semakin kecil nilai K-gram maka semakin tinggi hasil similarity yang
diperoleh dan nilai similarity tertinggi terletak pada K= 3 yaitu sebesar 18,54 %. Kemudian, hasil
pengujian perbandingan antara sistem pemeriksaan kesamaan dokumen dengan plagiarism checker
x dari 15 file dokumen, diperoleh nilai similarity tertinggi 10,29 % pada sistem pemeriksaan
dokumen dan pada plagiarism checker x nilai similarity tertinggi 14,06 %.