research

Word Sense Clustering

Abstract

Tato bakalářská práce se zabývá návrhem a implementací modulárního systému pro analýzu textového korpusu a následné vyhledávání sémanticky podobných slov. Systém umožňuje stemming korpusu, uživatel si může zvolit z různých způsobů analýzy korpus (matice spoluvýskytu, LSA).This bachelor's thesis deals with the design and implementation of a modular system focused on semantic similarity. System is able to stem the corpus and to analyze corpus in different ways - through coocurrence matrix or LSA.

    Similar works