3 research outputs found

    Light Verbs in Slovak

    Get PDF
    The paper aims at a lexical description of light verbs (LVs) in Slovak, with some implications for processing such verbs within the project of preparing the Dictionary of Multi-Word Naming Units. Analysis based on data gained from the Slovak National Corpus aims at a description of their status from the perspective of lexicalization and grammaticalization theory. The semantic status of LVs is discussed in theoretical works ranging from opinions favouring semantic emptiness of LVs, to assuming that LVs are not empty of meaning and have semi-lexical status. Corpus data also serve as the basis for an investigation of non-composionality, non-substitutability and non-modifiability as well as productivity patterns of particular LVCs. The paper also examines the opinions according to which LVs are in the initial stages of grammaticalization. In the paper Himmelmann´s idea (2004) of grammaticalization and lexicalization as processes that can be orthogonal or may even run in parallel is adopted

    Light verb constructions and their exploitation for morphological annotation

    Get PDF
    iv Abstract This Ph.D. thesis deals with light verb constructions (LVCs), such as provádět kontrolu (to perform a check) or chovat úctu (to show respect). It demonstrates how to apply theoretical knowledge of these constructions into practice, exploiting it during morphological disambiguation and thus potentially improving syntactic analysis. The theoretical part of the thesis covers three areas: light verb constructions, corpus annotation, and LanGr rule-based morphological disambiguation tagging. At first, LVCs are characterized, including their identification criteria, followed by a description of the current state of research on LVCs and a summary of papers published on the topic over the last fifteen years, with a particular emphasis on the syntactic approach to these constructions. A compilation of existing LVC inventories is also provided. Furthermore, Czech National Corpus written corpora tagging process is outlined, as it is closely related to the LanGr tool. Finally, LanGr rule creation and code implementation are covered. The practical part of the thesis addresses nominative-accusative case homonymy. New rules for the LanGr system are also developed to improve morphological annotation. In a case study, the most frequent forms of direct object LVCs are retrieved using data from the SYNv10 corpus....iii Abstrakt Disertační práce se zaměřuje na analytický predikát s kategoriálním slovesem (dále APKS), tedy spojení jako provádět kontrolu nebo chovat úctu. Ilustruje, jak zúročit teoretické poznání těchto spojení v praxi, vytěžit ho při morfologické disambiguaci, a tím potenciálně ovlivnit i syntaktickou analýzu. Teoretická část práce pokrývá tři oblasti - APKS, značkování korpusů a pravidlový disambiguační systém LanGr. APKS charakterizuje včetně kritérií pro jejich určování, popisuje současný stav jejich poznání a usouvztažňuje příspěvky k tématu, které vyšly v průběhu posledních patnácti let; důraz je přitom kladen zejména na syntaktický pohled na tyto konstrukce. Zároveň práce mapuje existující soupisy těchto spojení. Následuje popis procesu značkování psaných korpusů Českého národního korpusu, s nímž úzce souvisí i systém automatické morfologické disambiguace LanGr, kterému je věnována pozornost jak na teoretické úrovni tvorby pravidel, tak na úrovni jejich zápisu ve stejnojmenném programovacím jazyce. Praktická část práce se zaměřuje na konkrétní výsek morfologické homonymie akuzativních tvarů a zlepšuje morfologickou anotaci na základě nově vytvořených pravidel pro systém LanGr. Nejprve v první případové studii na datech z korpusu SYNv10 identifikuje pravidelnosti APKS s bezpředložkovým akuzativem,...Ústav teoretické a komputační lingvistikyInstitute of Theoretical and Computational LinguisticsFaculty of ArtsFilozofická fakult