3 research outputs found

    Magyar nyelvű webes szövegek morfológiai és szintaktikai annotációja

    Get PDF
    Cikkünkben bemutatjuk az első magyar, kézzel annotált, webes szövegeket tartalmazó korpuszt, melyet tesztadatbázisnak szánunk a webes szövegekre optimalizált nyelvi elemzőink fejlesztéséhez. A korpusz morfológiai és (összetevős és függőségi szemléletű) szintaktikai elemzést, valamint szemantikai és diskurzusbeli bizonytalan kifejezések annotációját tartalmazza. Beszámolunk a magyarlanc elemző webes szövegekre történő adaptálási kísérleteiről is

    Annotating Uncertainty in Hungarian Webtext

    Get PDF
    Uncertainty detection has been a popular topic in natural language processing, which manifested in the creation of several corpora for English. Here we show how the annotation guidelines origi-nally developed for English standard texts can be adapted to Hungarian webtext. We annotated a small corpus of Facebook posts for uncertainty phenomena and we illustrate the main character-istics of such texts, with special regard to uncertainty annotation. Our results may be exploited in adapting the guidelines to other languages or domains and later on, in the construction of automatic uncertainty detectors.

    XI. Magyar Számítógépes Nyelvészeti Konferencia

    Get PDF