48 research outputs found

    LeTs Preprocess: The multilingual LT3 linguistic preprocessing toolkit

    Get PDF
    This paper presents the LeTs Preprocess Toolkit, a suite of robust high-performance preprocessing modules including Part-of-Speech Taggers, Lemmatizers and Named Entity Recognizers. The currently supported languages are Dutch, English, French and German. We give a detailed description of the architecture of the LeTs Preprocess pipeline and describe the data and methods used to train each component. Ten-fold cross-validation results are also presented. To assess the performance of each module on different domains, we collected real-world textual data from companies covering various domains (a.o. automotive, dredging and human resources) for all four supported languages. For this multi-domain corpus, a manually verified gold standard was created for each of the three preprocessing steps. We present the performance of our preprocessing components on this corpus and compare it to the performance of other existing tools. 1

    Viering van 50 JAAR Vlaamse Televisie in België door de Vlaamse Openbare omroep VRT: Entertainend en Canoniserend

    No full text
    De viering van een halve eeuw televisie is momenteel in vele West-Europese landen aan de orde. Naast Nederland, dat in 1951 met televisie-uitzendingen van start ging, herdachten ook Duitsland, Engeland en Frankrijk, die alledrie reedsvoor de tweede wereldoorlog met uitzendingen experimenteerden, de nationale introductie van het televisiemedium. Met zijn officieel begin op 31 oktober 1953 staat België, waar het televisie-initiatief door de openbare (radio-)omroep werdgenomen, als vijfde in de rij
    corecore