Search CORE

3 research outputs found

Towards building a standard dataset for Arabic keyphrase extraction evaluation

Author: Basaldella M.
Demartini G.
Helmy M.
Maddalena E.
Mizzaro S.
Publication venue: 'Institute of Electrical and Electronics Engineers (IEEE)'
Publication date: 01/01/2016
Field of study

Keyphrases are short phrases that best represent a document content. They can be useful in a variety of applications, including document summarization and retrieval models. In this paper, we introduce the first dataset of keyphrases for an Arabic document collection, obtained by means of crowdsourcing. We experimentally evaluate different crowdsourced answer aggregation strategies and validate their performances against expert annotations to evaluate the quality of our dataset. We report about our experimental results, the dataset features

Crossref

Archivio istituzionale della ricerca - Università degli Studi di Udine

White Rose Research Online

University of Queensland eSpace

Metode Pembobotan Hibrida untuk Ekstraksi Frasa Kunci Bahasa Arab

Author: Arifin Agus Z.
Indraswari Rarasmaya
Kusuma Susanto Evan
Maryamah
Sholikah Rizka W.
Subkhi M. Bahrul
Publication venue: Institut Sains dan Teknologi Terpadu Surabaya (LPPM ISTTS)
Publication date: 31/10/2022
Field of study

Banyaknya informasi membuat proses pengindeksan dan pencarian inti dari dokumen menjadi permasalahan yang rumit. Sebagian besar dokumen yang tersedia tidak dilengkapi dengan kata kunci terkait. Hal ini sehingga memaksa pembaca untuk membaca seluruh dokumen untuk mendapat gambaran penuh dari konten seluruh dokumen. Ekstraksi frasa kunci otomatis yang menggunakan Algoritma YAKE memberi solusi cepat ekstraksi frasa kunci menggunakan fitur lokal dari sebuah dokumen. Namun, penggunaan fitur lokal saja membuat hasil ekstraksi menjadi kurang relevan karena diperlukan istilah signifikan yang muncul di dokumen lain. Masalah lain yang muncul adalah terdapat beberapa fitur lokal yang tidak dapat digunakan untuk bahasa Arab, misalnya huruf kapital. Pada penelitian ini, diusulkan metode pembobotan kata yang mengintegrasikan fitur statistik lokal dari sebuah dokumen dan fitur eksternal dari dokumen lain untuk sistem ekstraksi kata kunci. Metode ini dapat digunakan secara efektif pada bahasa Arab dan dapat digunakan pada bahasa lain yang tidak memiliki huruf kapital serta untuk dokumen-dokumen yang tidak terstruktur seperti berita atau karya ilmiah. Dari hasil uji coba telah dibuktikan bahwa performansi metode ini lebih baik daripada metode pembanding yaitu YAKE dan TF-IDF

Jurnal Sekolah Tinggi Teknik Surabaya

Metode Pembobotan Hibrida untuk Ekstraksi Frasa Kunci Bahasa Arab

Author: Arifin Agus Z.
Indraswari Rarasmaya
Kusuma Susanto Evan
Maryamah
Sholikah Rizka W.
Subkhi M. Bahrul
Publication venue: Institut Sains dan Teknologi Terpadu Surabaya (LPPM ISTTS)
Publication date: 31/10/2022
Field of study

Jurnal Sekolah Tinggi Teknik Surabaya

Jurnal LPPM iSTTS