1 research outputs found

    Automatic keyword extraction from text with standard computer procedures

    Get PDF
    Automatska ekstrakcija ključnih riječi iz teksta aktualan je istraživački problem u području računalne analize prirodnog jezika i pretraživanja informacija. Iako su razvijene brojne metode za ekstrakciju ključnih riječi iz teksta, njihova učinkovitost ovisna je o brojnim faktorima poput pristupa kojim su konstruirane, domene na koju su prilagođene, vrste jezika ili zadataka za koji su konstruirane i sl., a samim time prostor za napredak u smislu nadogradnje i poboljšanja, uvijek postoji. U ovom radu objašnjene su i rekonstruirane dvije postojeće metode – RAKE i MAUI, a koje su standardni predstavnici nenadzirane i nadzirane skupine metoda. Eksperimentalno je ispitano mogu li metode uspješno ekstrahirati ključne riječi iz tekstova pisanih na talijanskom jeziku, na kojem do sada nisu usporedno testirane. Za potrebe eksperimenta prikupljeni su i ručno označeni talijanski tekstovi. Efikasnost MAUI metode pokazala se perspektivnijom u odnosu na RAKE metodu što je već ranije potvrđeno u eksperimentu ekstrakcije ključnih riječi iz tekstova pisanih na engleskom jeziku.Automatic keyword extraction takes a great interest as a research issue in the field of natural language processing and information retrieval. Although numerous methods for keyword extraction task have been developed, their effectiveness depends on many factors such as the approach used in method development, the domain to which they are adapted, the type of language or tasks for which they are constructed, etc., and still, there is a room for progress and improvements. In this paper, two existing methods are explained and reconstructed - RAKE and MAUI, which are the standard representatives of the unsupervised and supervised group of keyword extraction methods. It was experimentally tested whether the methods could successfully extract keywords from texts written in Italian, which had not been tested so far. For the experimental purposes, Italian texts were collected and annotated with keywords. The effectiveness of the MAUI method proved to be more promising than the RAKE method, which was confirmed earlier in the keyword extraction experiment from texts written in English
    corecore