Skip to main content
Article thumbnail
Location of Repository

1

By Michal Toman, Roman Tesař and Karel Ježek

Abstract

Abstrakt. Příspěvek porovnává vliv různých normalizačních metod na klasifikační úlohu. Část článku je věnována popisu naší lemmatizační metody založené na použití tezauru EWN. Prezentujeme srovnání výsledků získaných EWN metodou a ostatními normalizačními metodami. Zkoumána je také celková míra ovlivnění výsledků klasifikace textu jeho předzpracováním – normalizací slov a odstraněním stop-slov. Klíčová slova: normalizace slov, lemmatizace, stemming, klasifikace

Year: 2013
OAI identifier: oai:CiteSeerX.psu:10.1.1.363.7445
Provided by: CiteSeerX
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • http://citeseerx.ist.psu.edu/v... (external link)
  • http://textmining.zcu.cz/publi... (external link)
  • http://textmining.zcu.cz/publi... (external link)
  • Suggested articles


    To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.