research
Pembuatan Program Aplikasi untuk Pendeteksian Kemiripan Dokumen Teks dengan Algoritma Smith-Waterman
- Publication date
- Publisher
Abstract
Salah satu cara untuk mendeteksi plagiat karya ilmiah adalah pembandingan antara dua dokumen yang diduga
sebagai hasil ciplakan (plagiat). Pembandingan antara dua dokumen dilakukan untuk mengetahui tingkat kemiripan antara
kedua dokumen tersebut. Hasil pembandingan dinyatakan dalam bentuk bobot atau nilai kemiripan dari dokumen
yang dibandingkan. Dalam penelitian ini pembandingan antara dokumen dilakukan dengan metode Smith-Waterman
atau Algoritma Smith-Waterman. Algoritma ini digunakan dalam bidang bioinformatika sebagai metode yang dapat menemukenali
(mengidentifikasi) local similarities (penyejajaran sekuens) yaitu proses penyusunan dua rangkaian/susunan
atau rentetan nukleotida atau susunan protein sehingga kemiripan antara dua sekuens tersebut akan terlihat. Berdasarkan
fungsi proses penyejajaran sekuens tersebut, algoritma ini dapat diterapkan ke dalam bentuk pemprograman komputer
untuk mendeteksi kemiripan antara dua dokumen teks yang dianggap cenderung sama dengan cara melihat kesamaan
isi dari kedua dokumen teks tersebut. Dalam pengukuran tingkat kemiripan antara dua dokumen teks, dilakukan pengolah
berdasarkan algoritma Smith-Waterman dengan urutan tahapan: pembacaan dokumen, penghitungan kesamaan
struktur, pengoptimalan, stemming, dan penghitungan bobot. Penguji cobaan aplikasi ini dilakukan dengan cara membandingkan
5 dokumen yang bervariasi dengan menggunakan beberapa nilai batas ambang pada kisaran 0-1. Dari hasil
uji coba didapat hasil bahwa semakin tinggi nilai batas ambang yang digunakan semakin terlihat kemiripan (keidentikan)
jika teks tersebut lolos dari batas ambang, demikian pula sebaliknya. Hal ini dikarenakan batas ambang yang digunakan
berfungsi sebagai nilai pembanding terhadap nilai hasil proses kesamaan struktur yang digunakan sebagai syarat untuk
melanjutkan proses penghitungan bobot kemiripan, dan apabila hasil bobot kurang dari nilai batas ambang maka
dokumen dianggap tidak memiliki kemiripan