Advanced searching in data from news portals

Abstract

Cílem této diplomové práce je realizovat jednoduché a rozšířené vyhledávání pro systém MediaGist v datech ze zpravodajských portálů. MediaGist je on-line systém pro kroslinguální analýzu agregovaných zpráv a komentářů založený na technologii sumarizace a analýze sentimentu. V první části této práce jsou popsány základní principy vyhledávání informací. Druhá část práce se věnuje porovnání nástrojů Elasticsearch a Apache Solr umožňujících textové vyhledávání. Dále je popsán návrh~a~implementace vyhledávání za pomoci nástroje Elasticsearch. Poslední část práce zahrnuje testování a vyhodnocení vytvořeného vyhledávání.ObhájenoThe purpose of this master thesis is to create simple and advanced searching for MediaGist system in data from news portals. MediaGist is an online system~for~crosslingual analysis of aggregated news and commentaries based on summarization and sentiment analysis technologies. In the first part of this work the basic principles of information retrieval are described. The second part deals with the comparison of Elasticsearch and Apache Solr, that allows text searching. Next is described design and implementation of the searching using the Elasticsearch tool. The last part contains testing and evaluation of the created searching

    Similar works