Sustav za davanje kontekstualiziranih preporuka na temelju rudarenja teksta

Kamenjaš, Lena

research

Sustav za davanje kontekstualiziranih preporuka na temelju rudarenja teksta

Authors: Lena Kamenjaš
Publication date: 28 November 2018
Publisher: University of Zagreb. Faculty of Science. Department of Mathematics.

Abstract

U ovom je radu predstavljen jedan način kako poboljšati pretraživanje po dokumentima pisanim prirodnim jezikom - otkrivanjem ključnih riječi dokumenata. Ukratko se priča o obradi prirodnog jezika, važnoj disciplini kod analize dokumenta. Zatim se priča o procesu otkrivanja ključnih riječi i podjeli metoda. Detaljnije se obrađuju metode korištene pri izradi aplikacije: TextRank i

tf-idf

algoritam. Prije opisa implementacije, navode se i ukratko opisuju korišteni alati i tehnologije za izradu aplikacije. Zatim se predstavlja postupak izrade aplikacije, koji se sastoji od pretprocesiranja, primjene algoritama (osnovna dva i njihove tri modifikacije) te postprocesiranja. Naposljetku se navodi usporedba rezultata te primjer dokumenta i nađenih ključnih riječi.This thesis presents one way of improving the process of searching documents written in natural language - by discovering keywords. It starts with a brief description of natural language processing, a sub-field of computer science, information engineering, and artificial intelligence that is very important for text analysis. Next chapter presents keyword extraction and its classification of methods. Two methods used in application are discussed in detail: TextRank and

tf-idf

algorithm. Before describing the implementation process, a list and a short description of used tools and technologies in application is given. Then follows the description of implementation process, which consists of pre-processing, application of algorithms (two basic and their three modifications) and post-processing. Finally, comparison between used methods and an example is given

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Repository of Faculty of Science, University of Zagreb

oai:repozitorij.pmf.unizg.hr:p...

Last time updated on 17/05/2019

Croatian Digital Thesis Repository

oai:zir.nsk.hr:pmf_5978

Last time updated on 20/05/2019

University of Zagreb Repository

oai:repozitorij.unizg.hr:pmf_5...

Last time updated on 20/05/2019