3 research outputs found
Magyar nyelvű webes szövegek morfológiai és szintaktikai annotációja
CikkĂĽnkben bemutatjuk az elsĹ‘ magyar, kĂ©zzel annotált, webes szövegeket tartalmazĂł korpuszt, melyet tesztadatbázisnak szánunk a webes szövegekre optimalizált nyelvi elemzĹ‘ink fejlesztĂ©sĂ©hez. A korpusz morfolĂłgiai Ă©s (összetevĹ‘s Ă©s fĂĽggĹ‘sĂ©gi szemlĂ©letű) szintaktikai elemzĂ©st, valamint szemantikai Ă©s diskurzusbeli bizonytalan kifejezĂ©sek annotáciĂłját tartalmazza. Beszámolunk a magyarlanc elemzĹ‘ webes szövegekre törtĂ©nĹ‘ adaptálási kĂsĂ©rleteirĹ‘l is
Annotating Uncertainty in Hungarian Webtext
Uncertainty detection has been a popular topic in natural language processing, which manifested in the creation of several corpora for English. Here we show how the annotation guidelines origi-nally developed for English standard texts can be adapted to Hungarian webtext. We annotated a small corpus of Facebook posts for uncertainty phenomena and we illustrate the main character-istics of such texts, with special regard to uncertainty annotation. Our results may be exploited in adapting the guidelines to other languages or domains and later on, in the construction of automatic uncertainty detectors.