10 research outputs found

    End to end approach for i2b2 2012 challenge based on Cross-lingual models

    Get PDF
    BACKGROUND - We propose a Cross-lingual approach to i2b2 2012 challenge for Clinical Records focused on the temporal relations in clinical narratives. Corpus of discharge summaries annotated with temporal information was provided for automatically extracting : (1) clinically significant events, including both clinical concepts such as problems, tests, treatments, and clinical departments, and events relevant to the patient’s clinical timeline, such as admissions, transfers between departments, etc; (2) temporal expressions, referring to the dates, times, duration, or frequencies in the clinical text. The values of the extracted temporal expressions had to be normalized to an ISO specification standard; and (3) temporal relations, among the clinical events and temporal expressions. GOALS - The objectives involved in the current work consists on outperforming previous State of the Art for the i2b2 2012 challenge and adapting Cross-lingual model into clinical specific domain with low Data resources available. METHODS - The task has been conceived as a pipeline of different modules, an event and temporal expression token-classifier and a text-classifier for relation extraction, each of them independently developed from the other. We used XLM-RoBERTa Cross-lingual model. RESULTS - For event detection, the proposed token-classifier obtains a 0.91 Span F1. For temporal expressions, our sentence-classifier achieves a 0.91 Span F1. For temporal relation, we propose sentence classifier based on sequential-taggers that performs at 0.29 F1 measure.DESKRIBAPENA - Narratiba klinikoen domeinuan i2b2 2012 erronkarako hizkuntzarteko ikuspegia jorratzen duen soluzioa proposatzen dugu. Erronka honek txosten medikuetan islatzen diren gertaeren arteko denbora-erlazioak iragartzea du helburu. Horretarako, lan hau alde batetik (1) klinikoki esanguratsuak diren gertaerak, adibidez, kontzeptu klinikoak, probak, tratamenduak, sail klinikoak eta bestetik, (2) denbora-adierazpenak, adibidez, txostenak esleituta duen data, denbora, iraupen edo maiztasuna adierazten duten espresioak antzeman eta bukatzeko gertaera klinikoen eta (3) denbora-adierazpenen arteako erlazioak anotatuta duen corpus batetik abiatzen da. HELBURUAK - Lanaren helburuak i2b2 2012 artearen egoera hobetzea eta Cross-lingual modeloa Data baliabide baxuak dituen domeinu kliniko espezifikora egokitzea dira. METODOAK - Lana modulu desberdinetako hobi gisa ulertu da, gertaera eta denbora-adierazpenetarako sekuentzia-markatzaileak, eta denbora-erlaziorako perpaus-sailkatzailea, independenteki garatu dira. XLM-RoBERTa Cross-lingual modeloa erabili izan da lan honetan. EMAITZAK - Gertaerak atzemateko, 0.91 Span F1 exekutatzen duen sekuentzia-markatzailea proposatzen dugu. Denbora-adierazpenetarako, 0.91 Span F1 egiten duen sekuentzia-markatzailea bat proposatzen dugu. Denbora-erlaziorako, 0.29 F1 neurria egiten duten sekuentzia-markatzaileetan oinarritutako perpaus-sailkatzailea proposatzen dugu

    End to end approach for i2b2 2012 challenge based on Cross-lingual models

    Get PDF
    BACKGROUND - We propose a Cross-lingual approach to i2b2 2012 challenge for Clinical Records focused on the temporal relations in clinical narratives. Corpus of discharge summaries annotated with temporal information was provided for automatically extracting : (1) clinically significant events, including both clinical concepts such as problems, tests, treatments, and clinical departments, and events relevant to the patient’s clinical timeline, such as admissions, transfers between departments, etc; (2) temporal expressions, referring to the dates, times, duration, or frequencies in the clinical text. The values of the extracted temporal expressions had to be normalized to an ISO specification standard; and (3) temporal relations, among the clinical events and temporal expressions. GOALS - The objectives involved in the current work consists on outperforming previous State of the Art for the i2b2 2012 challenge and adapting Cross-lingual model into clinical specific domain with low Data resources available. METHODS - The task has been conceived as a pipeline of different modules, an event and temporal expression token-classifier and a text-classifier for relation extraction, each of them independently developed from the other. We used XLM-RoBERTa Cross-lingual model. RESULTS - For event detection, the proposed token-classifier obtains a 0.91 Span F1. For temporal expressions, our sentence-classifier achieves a 0.91 Span F1. For temporal relation, we propose sentence classifier based on sequential-taggers that performs at 0.29 F1 measure.DESKRIBAPENA - Narratiba klinikoen domeinuan i2b2 2012 erronkarako hizkuntzarteko ikuspegia jorratzen duen soluzioa proposatzen dugu. Erronka honek txosten medikuetan islatzen diren gertaeren arteko denbora-erlazioak iragartzea du helburu. Horretarako, lan hau alde batetik (1) klinikoki esanguratsuak diren gertaerak, adibidez, kontzeptu klinikoak, probak, tratamenduak, sail klinikoak eta bestetik, (2) denbora-adierazpenak, adibidez, txostenak esleituta duen data, denbora, iraupen edo maiztasuna adierazten duten espresioak antzeman eta bukatzeko gertaera klinikoen eta (3) denbora-adierazpenen arteako erlazioak anotatuta duen corpus batetik abiatzen da. HELBURUAK - Lanaren helburuak i2b2 2012 artearen egoera hobetzea eta Cross-lingual modeloa Data baliabide baxuak dituen domeinu kliniko espezifikora egokitzea dira. METODOAK - Lana modulu desberdinetako hobi gisa ulertu da, gertaera eta denbora-adierazpenetarako sekuentzia-markatzaileak, eta denbora-erlaziorako perpaus-sailkatzailea, independenteki garatu dira. XLM-RoBERTa Cross-lingual modeloa erabili izan da lan honetan. EMAITZAK - Gertaerak atzemateko, 0.91 Span F1 exekutatzen duen sekuentzia-markatzailea proposatzen dugu. Denbora-adierazpenetarako, 0.91 Span F1 egiten duen sekuentzia-markatzailea bat proposatzen dugu. Denbora-erlaziorako, 0.29 F1 neurria egiten duten sekuentzia-markatzaileetan oinarritutako perpaus-sailkatzailea proposatzen dugu

    Identificador automático de relaciones temporales en textos clínicos basado en redes neuronales

    Get PDF
    Resumen: el proyecto constituye una aproximación de un identificador automático de relaciones temporales en textos clínicos basado en redes neuronales, el sistema es funcional y cuenta con la evidencia de un prototipo de alta fidelidad capaz de concretar la aplicación de técnicas ‘natural language processing’ NLP, ‘machine learning’ ML y ‘deep learning’ DL. En cuanto a la estructura del proyecto, cuenta con una introducción, que busca nutrir al lector de información suficiente para apoyar la lectura técnica, además se expone el Documento de Objetivos del Proyecto, donde se puede encontrar toda la información relativa a la gestión del proyecto, por otro lado se expone un compendio del estado del arte, en que nos hemos inspirado para las aproximaciones realizadas hasta el prototipo de alta fidelidad, después se detalla el: análisis, diseño e implementación realizados para el desarrollo del prototipo de alta fidelidad del sistema basado en BiLSTM + CRF, así como otros experimentos realizados, este desarrollo cuenta con resultados parciales que se exponen en las pruebas y de paso se contrastan con la competición internacional ‘i2b2’, actualizando el estado del arte en extracción de conceptos clínicos y expresiones temporales, por último se tratan los prototipos generados durante el proyecto, y se concluye con una crítica del proyecto, así como los trabajos futuros a realizar sobre el mismo. Por último, consideramos que sería buena idea la utilización del presente proyecto para futuras aproximaciones a nuevas áreas de aplicación, ya que el sistema descrito se considera genérico, y la dificultad en dichos acercamientos residiría en la generación del conjunto de entrenamiento pudiendo aprovecharse el formato IOB de dicha tarea, y unos ‘word embeddings’ pre entrenados concretamente para el acercamiento que se realice.Abstract: the project is an approximation to an automatic temporal relation identifier for clinical texts based on neural networks, the system is functional an has an evident high fidelity prototype that could accurate how to apply techniques as: natural language processing NLP, machine learning ML and deep learning DL. The project structure has an introduction to immerse lecturer into technical signature, moreover it has a project objectives document where it could be found all management information used to manage the project, in addition it has a state of the art summary into which we inspired our experiments trough the final prototype, later we detail the process of: analysis, design and implementation, based on BiLSTM + CRF to achieve high fidelity prototype, and other experiments made, we also have partial results summarized in testing section and we contrast the system with ‘i2b2’ international challenge, in this case we update the current state of the art in clinical concept extraction and time expression extraction tasks, finally we show the prototypes made for the system, and we review the work made, and besides we expose the future works on system. We finally suggest the use of the present work in future approximations into new application areas, because of the system is generic and the difficult would be in the data generation, it could be used the IOB format and pre trained word embedding s relative to the task studied.Laburpena: proiektua da sare neuronaletan oinarritutako testu klinikoetako denborazko erlazioko identifikatzaile automatikoko hurbilketa, sistema funtzionala da eta du ‘processing-a language naturala’ teknika aplikazioa NLP-a, ‘learning-a’ ML ‘machine-a’ eta ‘learning-a’ DL ‘deep-a’ zehazteko goi-fidelitate gaiko prototipo baten ziurtasuna. Proiektuaren, sarrerarekiko kontuaren irakurketa teknikoaren alde agertzeko informazio nahikoko elikatzea irakurleari| bilatzen duenaren, egiturari dagokionez gainera Proiektuaren Helburuetako Dokumentua erakusten da, proiektuaren kudeaketari buruzko informazio guztia aurki dezakeen tokian, bestalde erakusten da artearen egoeraren| laburpen bat, egindako goi-fidelitate-prototiporainoko hurbilketetarako inspirazioa hartu dugunaren, gero zehazten du: analisiak, diseinua eta inplementazioa BiLSTM-etan oinarritutako sistemaren goi-fidelitateko prototipoaren garapenerako egindakoak + CRF-a, egindako beste esperimentu batzuk bezala horrela, garapen honek ditu probetan eta iragaitzaz erakusten diren emaitza partzialak egiaztatzen dute ‘i2b2' nazioarteko lehiaketarekin, artearen egoera kontzeptu klinikoko erauzketan etadenborazko adierazpenetan eguneratuz, azkenik proiektuan zehar sortutako prototipoak tratatzen dira, eta amaitzen du proiektuaren kritikarekin, baita ere beraren gainean egiteko etorkizuneko lanekin. Azkenik, pentsatzen dugu ideia ona izango litzatekeela aplikazio-area berrietara etorkizuneko hurbiltzeetarako oraingo| proiektuaren erabilera, deskribatutako sistema generikotzat hartzen denez gero, eta aipaturiko hurbiltzeetako zailtasuna entrenamendu-tmultzoan etzango litzatekeela IOB-a aipaturiko zereginaren formatua, eta ‘embeddings-a’ zehazki egiten den hurbiltzerako aurre entrenatutako ‘word’ batzuk aprobetxatu ahal izanez

    Advances in monolingual and crosslingual automatic disability annotation in Spanish

    Get PDF
    Background Unlike diseases, automatic recognition of disabilities has not received the same attention in the area of medical NLP. Progress in this direction is hampered by obstacles like the lack of annotated corpus. Neural architectures learn to translate sequences from spontaneous representations into their corresponding standard representations given a set of samples. The aim of this paper is to present the last advances in monolingual (Spanish) and crosslingual (from English to Spanish and vice versa) automatic disability annotation. The task consists of identifying disability mentions in medical texts written in Spanish within a collection of abstracts from journal papers related to the biomedical domain. Results In order to carry out the task, we have combined deep learning models that use different embedding granularities for sequence to sequence tagging with a simple acronym and abbreviation detection module to boost the coverage. Conclusions Our monolingual experiments demonstrate that a good combination of different word embedding representations provide better results than single representations, significantly outperforming the state of the art in disability annotation in Spanish. Additionally, we have experimented crosslingual transfer (zero-shot) for disability annotation between English and Spanish with interesting results that might help overcoming the data scarcity bottleneck, specially significant for the disabilities.This work was partially funded by the Spanish Ministry of Science and Innovation (MCI/AEI/FEDER, UE, DOTT-HEALTH/PAT-MED PID2019-106942RB-C31), the Basque Government (IXA IT1570-22), MCIN/AEI/ 10.13039/501100011033 and European Union NextGeneration EU/PRTR (DeepR3, TED2021-130295B-C31) and the EU ERA-Net CHIST-ERA and the Spanish Research Agency (ANTIDOTE PCI2020-120717-2)

    Levantamiento del velo corporativo. Panorama y perspectivas. El caso colombiano

    Get PDF
    Son múltiples y constantes los debates que se han dado en la comunidad jurídica nacional sobre permitir que los socios o accionistas de una sociedad respondan directamente con su patrimonio por las acreencias de la persona jurídica a través de la utilización de la "teoría del levantamiento del velo corporativo". Dada la importancia de este tema, expertos colombianos de primer nivel se reúnen en esta obra para exponer sus puntos de vista sobre la aplicación de esta institución en Colombia. Adicionalmente, este libro incluye el informe de ejecución del proyecto de investigación , adelantado por la línea de investigación en Derecho Comercial del Grupo de Derecho Privado de la Facultad de Jurisprudencia, el cual fue financiado por el Centro de Investigaciones, Estudios y Consultoría (CIEC) de la Universidad del Rosario.Dada la importancia de este tema, expertos colombianos de primer nivel se reúnen en esta obra para exponer sus puntos de vista sobre la aplicación de esta institución en Colombia

    Aproximación al contexto de producción de la obra pictórica “Milagro de la Virgen de Guápulo en su Santuario”, atribuida a Miguel de Santiago (Siglo XVII)

    No full text
    La obra “Milagro de la Virgen de Guápulo en su Santuario” fue estudiada como un registro histórico de la época desde una perspectiva multidisciplinaria donde convergen la historia del arte, el arte y las ciencias experimentales, para comprender los aspectos tecnológicos involucrados en su factura. Con el uso combinado de técnicas analíticas no invasivas como IRFC y FRX y la mínima extracción de muestras para análisis por FTIR y MEB-EDX se identificaron diez pigmentos/colorantes y se dilucidaron las secuencias técnico pictóricas empleadas por su artífice. El leguaje simbólico, la calidad y costo de los materiales usados, así como la valía del ejecutante determinaron el algo prestigio y dignidad de la obra

    La función de la Corte Penal Internacional: visiones plurales desde una perspectiva interdisciplinar

    No full text
    El presente libro hace parte de los trabajos del grupo de justicia nacional de la “Red de Investigación Perspectivas Iberoamericanas sobre la Justicia”, coordinada desde el Instituto Ibero-Americano de la Haya para la Paz, los Derechos Humanos y la Justicia Internacional (IIH) (Países Bajos). Así mismo, se inscribe dentro de los proyectos de investigación: (a) “La función de la Corte Penal Internacional desde las teorías de la justicia en el derecho internacional” (2019-2020), cofinanciado por la Facultad de Jurisprudencia de la Universidad del Rosario (Bogotá, Colombia) y el IIH (Países Bajos); y (b) “La respuesta del derecho internacional a la corrupción asociada al crimen transnacional organizado” (2019-2021), con número de referencia VFPC009, cofinanciado por la Dirección de Investigación e Innovación y la Facultad de Jurisprudencia de la Universidad del Rosario (Bogotá, Colombia), así como por el IIH (Países Bajos). Ambos proyectos se encuentran adscritos a la línea de investigación “Crítica al derecho internacional desde fundamentos filosóficos”, del Grupo de Investigación en DI de la Facultad de Jurisprudencia de la Universidad del Rosario

    Primer Encuentro Internacional de Experiencias de Investigación en Ciencias Administrativas

    No full text
    Este evento de investigación organizado por la Escuela de Administración de la Universidad del Rosario surgió como una iniciativa para fomentar la investigación formativa en áreas administrativas. El evento, al que asistieron 165 participantes, contó con dos conferencias centrales, 30 ponencias presentadas en 8 simposios y 7 posters. La participación de distintas universidades permitió un intercambio académico muy importante y formativo para los ponentes y asistentes en general, promoviendo el interés por la investigación en el campo de la administración, el cual fue el interés central de este encuentro. Este encuentro recibió el apoyo de las directivas de la Universidad del Rosario, la Señora vicerrectora Stephanie Lavaux, el Señor Decano de la Escuela de Administración, Dr. Alejandro Cheyne, ACBSP (Accreditation Council for Business Schools & Programs) y Asociación Colombiana de Facultades de Administración (ASCOLFA)

    NEOTROPICAL XENARTHRANS: a data set of occurrence of xenarthran species in the Neotropics

    No full text
    Xenarthrans—anteaters, sloths, and armadillos—have essential functions for ecosystem maintenance, such as insect control and nutrient cycling, playing key roles as ecosystem engineers. Because of habitat loss and fragmentation, hunting pressure, and conflicts with domestic dogs, these species have been threatened locally, regionally, or even across their full distribution ranges. The Neotropics harbor 21 species of armadillos, 10 anteaters, and 6 sloths. Our data set includes the families Chlamyphoridae (13), Dasypodidae (7), Myrmecophagidae (3), Bradypodidae (4), and Megalonychidae (2). We have no occurrence data on Dasypus pilosus (Dasypodidae). Regarding Cyclopedidae, until recently, only one species was recognized, but new genetic studies have revealed that the group is represented by seven species. In this data paper, we compiled a total of 42,528 records of 31 species, represented by occurrence and quantitative data, totaling 24,847 unique georeferenced records. The geographic range is from the southern United States, Mexico, and Caribbean countries at the northern portion of the Neotropics, to the austral distribution in Argentina, Paraguay, Chile, and Uruguay. Regarding anteaters, Myrmecophaga tridactyla has the most records (n = 5,941), and Cyclopes sp. have the fewest (n = 240). The armadillo species with the most data is Dasypus novemcinctus (n = 11,588), and the fewest data are recorded for Calyptophractus retusus (n = 33). With regard to sloth species, Bradypus variegatus has the most records (n = 962), and Bradypus pygmaeus has the fewest (n = 12). Our main objective with Neotropical Xenarthrans is to make occurrence and quantitative data available to facilitate more ecological research, particularly if we integrate the xenarthran data with other data sets of Neotropical Series that will become available very soon (i.e., Neotropical Carnivores, Neotropical Invasive Mammals, and Neotropical Hunters and Dogs). Therefore, studies on trophic cascades, hunting pressure, habitat loss, fragmentation effects, species invasion, and climate change effects will be possible with the Neotropical Xenarthrans data set. Please cite this data paper when using its data in publications. We also request that researchers and teachers inform us of how they are using these data
    corecore