research

Pembuatan Program Aplikasi untuk Pendeteksian Kemiripan Dokumen Teks dengan Algoritma Smith-Waterman

Abstract

Salah satu cara untuk mendeteksi plagiat karya ilmiah adalah pembandingan antara dua dokumen yang diduga sebagai hasil ciplakan (plagiat). Pembandingan antara dua dokumen dilakukan untuk mengetahui tingkat kemiripan antara kedua dokumen tersebut. Hasil pembandingan dinyatakan dalam bentuk bobot atau nilai kemiripan dari dokumen yang dibandingkan. Dalam penelitian ini pembandingan antara dokumen dilakukan dengan metode Smith-Waterman atau Algoritma Smith-Waterman. Algoritma ini digunakan dalam bidang bioinformatika sebagai metode yang dapat menemukenali (mengidentifikasi) local similarities (penyejajaran sekuens) yaitu proses penyusunan dua rangkaian/susunan atau rentetan nukleotida atau susunan protein sehingga kemiripan antara dua sekuens tersebut akan terlihat. Berdasarkan fungsi proses penyejajaran sekuens tersebut, algoritma ini dapat diterapkan ke dalam bentuk pemprograman komputer untuk mendeteksi kemiripan antara dua dokumen teks yang dianggap cenderung sama dengan cara melihat kesamaan isi dari kedua dokumen teks tersebut. Dalam pengukuran tingkat kemiripan antara dua dokumen teks, dilakukan pengolah berdasarkan algoritma Smith-Waterman dengan urutan tahapan: pembacaan dokumen, penghitungan kesamaan struktur, pengoptimalan, stemming, dan penghitungan bobot. Penguji cobaan aplikasi ini dilakukan dengan cara membandingkan 5 dokumen yang bervariasi dengan menggunakan beberapa nilai batas ambang pada kisaran 0-1. Dari hasil uji coba didapat hasil bahwa semakin tinggi nilai batas ambang yang digunakan semakin terlihat kemiripan (keidentikan) jika teks tersebut lolos dari batas ambang, demikian pula sebaliknya. Hal ini dikarenakan batas ambang yang digunakan berfungsi sebagai nilai pembanding terhadap nilai hasil proses kesamaan struktur yang digunakan sebagai syarat untuk melanjutkan proses penghitungan bobot kemiripan, dan apabila hasil bobot kurang dari nilai batas ambang maka dokumen dianggap tidak memiliki kemiripan

    Similar works