1 research outputs found

    Semantic resources in pharmacovigilance: a corpus and an ontology for drug-drug interactions

    Get PDF
    Menci贸n Internacional en el t铆tulo de doctorNowadays, with the increasing use of several drugs for the treatment of one or more different diseases (polytherapy) in large populations, the risk for drugs combinations that have not been studied in pre-authorization clinical trials has increased. This provides a favourable setting for the occurrence of drug-drug interactions (DDIs), a common adverse drug reaction (ADR) representing an important risk to patients safety, and an increase in healthcare costs. Their early detection is, therefore, a main concern in the clinical setting. Although there are different databases supporting healthcare professionals in the detection of DDIs, the quality of these databases is very uneven, and the consistency of their content is limited. Furthermore, these databases do not scale well to the large and growing number of pharmacovigilance literature in recent years. In addition, large amounts of current and valuable information are hidden in published articles, scientific journals, books, and technical reports. Thus, the large number of DDI information sources has overwhelmed most healthcare professionals because it is not possible to remain up to date on everything published about DDIs. Computational methods can play a key role in the identification, explanation, and prediction of DDIs on a large scale, since they can be used to collect, analyze and manipulate large amounts of biological and pharmacological data. Natural language processing (NLP) techniques can be used to retrieve and extract DDI information from pharmacological texts, supporting researchers and healthcare professionals on the challenging task of searching DDI information among different and heterogeneous sources. However, these methods rely on the availability of specific resources providing the domain knowledge, such as databases, terminological vocabularies, corpora, ontologies, and so forth, which are necessary to address the Information Extraction (IE) tasks. In this thesis, we have developed two semantic resources for the DDI domain that make an important contribution to the research and development of IE systems for DDIs. We have reviewed and analyzed the existing corpora and ontologies relevant to this domain, based on their strengths and weaknesses, we have developed the DDI corpus and the ontology for drug-drug interactions (named DINTO). The DDI corpus has proven to fulfil the characteristics of a high-quality gold-standard, and has demonstrated its usefulness as a benchmark for the training and testing of different IE systems in the SemEval-2013 DDIExtraction shared task. Meanwhile, DINTO has been used and evaluated in two different applications. Firstly, it has been proven that the knowledge represented in the ontology can be used to infer DDIs and their different mechanisms. Secondly, we have provided a proof-of-concept of the contribution of DINTO to NLP, by providing the domain knowledge to be exploited by an IE pilot prototype. From these results, we believe that these two semantic resources will encourage further research into the application of computational methods to the early detection of DDIs. This work has been partially supported by the Regional Government of Madrid under the Research Network MA2VICMR [S2009/TIC-1542], by the Spanish Ministry of Education under the project MULTIMEDICA [TIN2010-20644-C03-01] and by the European Commission Seventh Framework Programme under TrendMiner project [FP7-ICT287863].Hoy en d铆a ha habido un notable aumento del n煤mero de pacientes polimedicados que reciben simult谩neamente varios f谩rmacos para el tratamiento de una o varias enfermedades. Esta situaci贸n proporciona el escenario ideal para la prescripci贸n de combinaciones de f谩rmacos que no han sido estudiadas previamente en ensayos cl铆nicos, y puede dar lugar a un aumento de interacciones farmacol贸gicas (DDIs por sus siglas en ingl茅s). Las interacciones entre f谩rmacos son un tipo de reacci贸n adversa que supone no s贸lo un riesgo para los pacientes, sino tambi茅n una importante causa de aumento del gasto sanitario. Por lo tanto, su detecci贸n temprana es crucial en la pr谩ctica cl铆nica. En la actualidad existen diversos recursos y bases de datos que pueden ayudar a los profesionales sanitarios en la detecci贸n de posibles interacciones farmacol贸gicas. Sin embargo, la calidad de su informaci贸n var铆a considerablemente de unos a otros, y la consistencia de sus contenidos es limitada. Adem谩s, la actualizaci贸n de estos recursos es dif铆cil debido al aumento que ha experimentado la literatura farmacol贸gica en los 煤ltimos a帽os. De hecho, mucha informaci贸n sobre DDIs se encuentra dispersa en art铆culos, revistas cient铆ficas, libros o informes t茅cnicos, lo que ha hecho que la mayor铆a de los profesionales sanitarios se hayan visto abrumados al intentar mantenerse actualizados en el dominio de las interacciones farmacol贸gicas. La ingenier铆a inform谩tica puede representar un papel fundamental en este campo permitiendo la identificaci贸n, explicaci贸n y predicci贸n de DDIs, ya que puede ayudar a recopilar, analizar y manipular grandes cantidades de datos biol贸gicos y farmacol贸gicos. En concreto, las t茅cnicas del procesamiento del lenguaje natural (PLN) pueden ayudar a recuperar y extraer informaci贸n sobre DDIs de textos farmacol贸gicos, ayudando a los investigadores y profesionales sanitarios en la complicada tarea de buscar esta informaci贸n en diversas fuentes. Sin embargo, el desarrollo de estos m茅todos depende de la disponibilidad de recursos espec铆ficos que proporcionen el conocimiento del dominio, como bases de datos, vocabularios terminol贸gicos, corpora u ontolog铆as, entre otros, que son necesarios para desarrollar las tareas de extracci贸n de informaci贸n (EI). En el marco de esta tesis hemos desarrollado dos recursos sem谩nticos en el dominio de las interacciones farmacol贸gicas que suponen una importante contribuci贸n a la investigaci贸n y al desarrollo de sistemas de EI sobre DDIs. En primer lugar hemos revisado y analizado los corpora y ontolog铆as existentes relevantes para el dominio y, en base a sus potenciales y limitaciones, hemos desarrollado el corpus DDI y la ontolog铆a para interacciones farmacol贸gicas DINTO. El corpus DDI ha demostrado cumplir con las caracter铆sticas de un est谩ndar de oro de gran calidad, as铆 como su utilidad para el entrenamiento y evaluaci贸n de distintos sistemas en la tarea de extracci贸n de informaci贸n SemEval-2013 DDIExtraction Task. Por su parte, DINTO ha sido utilizada y evaluada en dos aplicaciones diferentes. En primer lugar, hemos demostrado que esta ontolog铆a puede ser utilizada para inferir interacciones entre f谩rmacos y los mecanismos por los que ocurren. En segundo lugar, hemos obtenido una primera prueba de concepto de la contribuci贸n de DINTO al 谩rea del PLN al proporcionar el conocimiento del dominio necesario para ser explotado por un prototipo de un sistema de EI. En vista de estos resultados, creemos que estos dos recursos sem谩nticos pueden estimular la investigaci贸n en el desarrollo de m茅todos computaciones para la detecci贸n temprana de DDIs. Este trabajo ha sido financiado parcialmente por el Gobierno Regional de Madrid a trav茅s de la red de investigaci贸n MA2VICMR [S2009/TIC-1542], por el Ministerio de Educaci贸n Espa帽ol, a trav茅s del proyecto MULTIMEDICA [TIN2010-20644-C03-01], y por el S茅ptimo Programa Macro de la Comisi贸n Europea a trav茅s del proyecto TrendMiner [FP7-ICT287863].This work has been partially supported by the Regional Government of Madrid under the Research Network MA2VICMR [S2009/TIC-1542], by the Spanish Ministry of Education under the project MULTIMEDICA [TIN2010-20644-C03-01] and by the European Commission Seventh Framework Programme under TrendMiner project [FP7-ICT287863].Programa Oficial de Doctorado en Ciencia y Tecnolog铆a Inform谩ticaPresidente: Asunci贸n G贸mez P茅rez.- Secretario: Mar铆a Bel茅n Ruiz Mezcua.- Vocal: Mariana Neve
    corecore