2 research outputs found

    Extraction of temporal information of the DBpedia: Integration proposal in a semi-structured corpus

    Get PDF
    En este trabajo, se hace una propuesta para la extracción automática de información temporal en la DBpedia, suficientemente general para ser aplicada a diferentes dominios. Se experimenta en un dominio concreto, para el que se identificarán y gestionarán recursos DBpedia relacionados. Con la información temporal extraída de los recursos, se alimentará una línea de tiempo y se intersecará a su vez con la información temporal extraída del dominio, en este caso del corpus DIMH (textos semiestructurados o fichas). A continuación, se enriquecerán las fichas originales con la información temporal y se visualizarán y accederá a los resultados organizados sobre la base de su dimensión léxica y temporal. Ante la ausencia de un gold standard para evaluar intrínsecamente la propuesta, se aplican criterios dependientes del dominio y de los usuarios y se pone a disposición de la comunidad científica (GitHub) el corpus anotado temporalmente.The goal of this work is to make a proposal for the automatic extraction of temporal information in the DBpedia, general enough to be applied to different domains. The experiment is performed using a concrete domain by the identification and management of domain related DBpedia resources. With the relevant temporal information extracted from the resources it will be feed a timeline and intersected with the temporal information of the DIMH corpus (semi-structured texts or cards). Thus, we will enrich these cards with related events of the timeline. In order to visualize the results, we are using a graphical interface to facilitate the lexical and the temporal information access. In the absence of a gold standard to intrinsically evaluate the proposal, it will be applied domain and users dependent criteria and the annotated corpus is made available to the scientific community (GitHub).Este trabajo ha sido financiado parcialmente por los proyectos DIMH (HAR2012-31117) y Musacces (S2015/HUM3494)

    Anotació del focus de la negació i de la temporalitat en informes mèdics

    Get PDF
    Màster d'Humanitats Digitals, Facultat d'Informació i Mitjans Audiovisuals, Universitat de Barcelona. Curs: 2020-2021. Tutor: Taulé Delor, Mariona.En aquest treball, Anotació del focus de la negació i de la temporalitat en el domini mèdic, presentem les característiques del subllenguatge mèdic i ens centrem en el tractament del focus de la negació en documents del domini mèdic per a l’ensinistrament de sistemes de detecció de la negació basats en l’Aprenentatge Automàtic. En l’àrea de l’extracció d’informació l’expressió de la negació encara resulta un aspecte problemàtic, tot i que el seu tractament és important per comprendre correctament els textos. Volem contribuir en l’estudi del focus de la negació i crear un nou recurs lingüístic, el corpus ClUB-21 i la guia d’anotació corresponent. Tractem també la temporalitat i els diferents tipus d’expressions temporals per l’ambigüitat que generen a l’hora d’identificar el focus de la negació
    corecore