Search CORE

2 research outputs found

THE CONSTRUCTION OF INDONESIAN-ENGLISH CROSS LANGUAGE PLAGIARISM DETECTION SYSTEM USING FINGERPRINTING TECHNIQUE

Author: Alfikri Zakiy Firdaus
Purwarianti Ayu
Publication venue: 'Faculty of Computer Science, Universitas Indonesia'
Publication date: 01/01/2012
Field of study

Cross language plagiarism detection is an important task since it can protect person intellectual property right. Since English is the most popular international language, we proposed an Indonesian-English cross language plagiarism detection to handle such problem in Indonesian-English domain where the suspected plagiarism document is written in Indonesian and the source document is written in English. To minimize translation error, we build the system by translating the Indonesian document into English and then compare the translated document with the English document collection. The detection system consists of preprocess component, heuristic retrieval component, and detailed analysis component. The main technique used in retrieval process is fingerprinting which can extract lexical features from text which is suitable to be used to detect plagiarism done using literal translation method. In this paper, we also propose additional methods to be implemented in heuristic retrieval component to increase the performance of the system: phrase chunking, stop word removal, stemming, and synonym selection. We evaluated systemâ€™s performance and the effects of additional methods to systemâ€™s performance, provided several data test sets which represents a plagiarism type. From the experiments, we concluded that the system works on 83.33% of test cases. We also concluded that mainly all additional methods except the phrase chunking have good effects in enhancing the system accuracy. Deteksi plagiarisme lintas bahasa merupakan hal yang penting untuk melindungi hak kekayaan intelektual. Bahasa Inggris adalah bahasa internasional yang paling populer, karenanya peneliti mengusulkan deteksi plagiarisme lintas bahasa Indonesia-Inggris untuk menangani masalah tersebut di mana domain dokumen yang diduga plagiat ditulis dalam bahasa Indonesia dan dokumen sumber ditulis dalam bahasa Inggris. Untuk meminimalkan kesalahan terjemahan, peneliti membangun sistem dengan menerjemahkan dokumen bahasa Indonesia ke bahasa Inggris dan kemudian membandingkan dokumen yang diterjemahkan dengan koleksi dokumen bahasa Inggris. Sistem pendeteksian ini terdiri dari komponen preprocess, komponen pencarian heuristik, dan komponen analisis detail. Teknik utama yang digunakan dalam temu kembali informasi adalah fingerprinting yang dapat mengekstrak fitur leksikal dari teks yang cocok digunakan untuk mendeteksi plagiarisme dengan menggunakan metode terjemahan harfiah. Dalam tulisan ini, peneliti juga mengusulkan metode-metode tambahan yang akan diimplementasikan dalam komponen pengambilan heuristik untuk meningkatkan kinerja system seperti chunking frase, penghilangan stop word, stemming, dan pemilihan sinonim. Peneliti mengevaluasi kinerja sistem dan efek dari metode tambahan untuk kinerja sistem, dengan menyediakan sekumpulan skenario tes beberapa data yang merepresentasikan plagiarisme. Dari pengujian diperoleh kesimpulan bahwa sistem bekerja pada 83,33% kasus uji. Peneliti juga menyimpulkan bahwa terutama semua metode tambahan kecuali chunking frase memiliki efek yang baik dalam meningkatkan akurasi sistem

Neliti

Directory of Open Access Journals

Jurnal Ilmu Komputer dan Informasi

Academic Plagiarism Detection

Author: Abnar Samira
Alberts Houda
Alfikri Zakiy Firdaus
Alvi Faisal
Alzahrani Salha
An Vo Ngoc Phuoc
Asghari Habibollah
Bagnall Douglas
Bagnall Douglas
Bartoli Alberto
Bela Gipp
Bensalem Imene
Billah Nagoudi El Moatez
Bobicev Victoria
Buscaldi Davide
Castillo Esteban
Castro Daniel
Ceska Zdenek
Chudá Daniela
Dan Avishek
Dawn Arnav Kumar
Dharani T.
Diego
Ehsan Nava
Elizalde Victoria
Elizalde Victoria
Esteki Fezeh
Fagan Jody Condit
Feng Vanessa Wei
Fishman Teddi
Franco-Salvador Marc
Fréry Jordan
Gabrilovich Evgeniy
García-Mondeja Yasmany
Garg Urvashi
Ghaeini M. R.
Gharavi Erfaneh
Gillam Lee
Gipp Bela
Glinos Demetrios G.
Goutte Cyril
Gross Philipp
Gupta Deepa
Gutierrez Josue
Gómez-Adorno Helena
Gómez-Adorno Helena
Hagen Matthias
Haggag Osama
Halvani Oren
Halvani Oren
Halvani Oren
Halvani Oren
Harvey Sarah
Hussain
Hussein Ashraf S.
Hürlimann Manuela
Ibnu Subroto Imam Much
Jankowska Magdalena
Jankowska Magdalena
Jayapal Arun
Jiffriya M. A. C.
Juola Patrick
Juola Patrick
Kanjirangat Vani
Kanjirangat Vani
Kanjirangat Vani
Karaś Daniel
Kern Roman
Khan Imtiaz H.
Khan Jamal Ahmad
Khonji Mahmoud
Khoshnavataher Khadijeh
Kocher Mirco
Kocher Mirco
Kocher Mirco
Kong Leilei
Kong Leilei
Kong Leilei
Kong Leilei
Kuznetsov Mikhail
Layton Robert
Ledesma Paola
Lee Taemin
Magooda Ahmed
Mahgoub Ashraf Y.
Maitra Promita
Mayor Cristhian
Modaresi Pashutan
Mohebbi Majid
Momtaz Mozhgan
Moreau Erwan
Moreau Erwan
Moreau Erwan
Norman Meuschke
Pacheco María Leonor
Palkovskii Yurii
Palkovskii Yurii
Pertile Solange
Petmanson Timo
Pilehvar Mohammad Taher
Posadas-Durán Juan-Pablo
Potthast Martin
Potthast Martin
Potthast Martin
Potthast Martin
Potthast Martin
Prakash Amit
Rafiei Javad
Rakian Shima
Ravi N. Riya
Rexha Andi
Riya Ravi N
Rodríguez Torrejón Diego Antonio
Safin Kamil
Saini Anuj
Sanchez-Perez Miguel A
Sanchez-Perez Miguel A.
Sari Yunita
Sari Yunita
Schmidt Andreas
Seidman Shachar
Shrestha Prasha
Shrestha Prasha
Siddiqui Muazzam Ahmed
Sittar Abdul
Soori Hussein
Stamatatos Efstathios
Stamatatos Efstathios
Stamatatos Efstathios
Suchomel Šimon
Suchomel Šimon
Suchomel Šimon
Sánchez-Vega Fernando
Tomáš Foltýnek
Tschuggnall Michael
van Dam Michiel
Vartapetiance Anna
Veselý Ondřej
Vilariño Darnes
Wang Shuai
Wibowo Agung Toto
Williams Kyle
Williams Kyle
Williams Kyle
Yao Xuchen
Zmiycharov Valentin
Zubarev Denis
Publication venue: 'Association for Computing Machinery (ACM)'
Publication date
Field of study

Crossref