Vysoká škola báňská - Technická univerzita Ostrava
Abstract
Import 22/07/2015Cílem práce bylo porovnat booleovský model a model založený na signaturních souborech. Práce uvádí teoretické základy obou modelů, je zde tedy popsáno jak reprezentují dokumenty a jak přistupují k vyhodnocení dotazů zadaných uživatelem. Vytvořené aplikace byly použity pro srovnání, kde se porovnávalo vytváření indexu z hlediska času potřebného pro vytvoření, tak i paměti, kterou tento index zabírá na disku. Poté byly porovnány výsledky vyhodnocení pro různé dotazy a čas, který byl u obou modelů potřebný. Z důvodu, že signaturní soubory pro dotaz vybírají i ty dokumenty, které nejsou relevantní, bylo provedeno porovnání nastavovaných hodnot pro zjištění nejvhodnějšího nastavení, které by vykazovalo nejlepší výsledky.The aim of the study was to compare boolean model and model based on signature files. The study presents the theoretical foundations of both models, so here is described how they represent documents and how they approach to the evaluation of the queries entered by the user. Created applications were used for comparison, where the index creation was compared in terms of required time for the creation and the memory that index occupies on the disk. After that the evaluation results were compared for different queries and time, which was needed for evaluation in both models. For the reason, that signature files select for the query even those documents, that are not relevant, so a comparison of set values was made to determine the best settings, which showed the best results.460 - Katedra informatikyvelmi dobř