27 research outputs found

    Development of bioinformatics tools and studies in biomedical association networks for the analysis of human genetic diseases

    Get PDF
    Fecha de lectura de Tesis Doctoral: 18 de marzo 2019.El presente trabajo de tesis doctoral se centra en el análisis en red y desarrollo de herramientas bioinformáticas para la determinación de las causas que dan lugar a las enfermedades con base genética. Mediante el análisis de sistemas de red se pueden asociar fenotipos patológicos y las regiones del genoma que potencialmente sean su causa a partir de información de pacientes. Estas asociaciones fenotipo-genotipo pueden emplearse para el desarrollo de herramientas de apoyo al diagnóstico genético de pacientes con un cuadro fenotípico complejo, de manera que puedan dar información sobre las regiones del genoma que potencialmente estén afectadas en un paciente a partir de sus fenotipos patológicos observados. Del mismo modo, estas regiones asociadas a fenotipos patológicos pueden analizarse para determinar los elementos funcionales del genoma que sean la causa de la enfermedad. Este análisis incluye tanto genes como elementos reguladores, ya que se ha demostrado que un 80% de las enfermedades caracterizadas mediante análisis del genoma completo han sido asociadas a regiones no codificantes del genoma, en las cuales se encuentran los elementos reguladores. Una vez determinados los elementos funcionales existentes en las regiones del genoma asociadas a fenotipos patológicos, se pueden determinar los sistemas biológicos que estén afectados en el paciente. Sin embargo, no todos los genes tienen anotaciones funcionales que muestren a qué sistemas afectan. Esta funcionalidad viene dada por el producto génico, las proteínas, que a su vez constan de dominios que les confieren su función y/o estructura. De nuevo, mediante análisis de red se pueden asociar dominios de proteínas con anotaciones funciones a partir de información de proteínas, con el fin de poder usar esas asociaciones dominio-función para predecir la posible función desconocida de proteínas en base a sus dominios

    Breaking rules: taking Complex Ontology Alignment beyond rule­based approaches

    Get PDF
    Tese de mestrado, Ciência de Dados, Universidade de Lisboa, Faculdade de Ciências, 2021As ontologies are developed in an uncoordinated manner, differences in scope and design compromise interoperability. Ontology matching is critical to address this semantic heterogeneity problem, as it finds correspondences that enable integrating data across the Semantic Web. One of the biggest challenges in this field is that ontology schemas often differ conceptually, and therefore reconciling many real¬world ontology pairs (e.g., in geography or biomedicine) involves establishing complex mappings that contain multiple entities from each ontology. Yet, for the most part, ontology matching algorithms are restricted to finding simple equivalence mappings between ontology entities. This work presents novel algorithms for Complex Ontology Alignment based on Association Rule Mining over a set of shared instances between two ontologies. Its strategy relies on a targeted search for known complex patterns in instance and schema data, reducing the search space. This allows the application of semantic¬based filtering algorithms tailored to each kind of pattern, to select and refine the most relevant mappings. The algorithms were evaluated in OAEI Complex track datasets under two automated approaches: OAEI’s entity¬based approach and a novel element¬overlap–based approach which was developed in the context of this work. The algorithms were able to find mappings spanning eight distinct complex patterns, as well as combinations of patterns through disjunction and conjunction. They were able to efficiently reduce the search space and showed competitive performance results comparing to the State of the Art of complex alignment systems. As for the comparative analysis of evaluation methodologies, the proposed element¬overlap–based evaluation strategy was shown to be more accurate and interpretable than the reference-based automatic alternative, although none of the existing strategies fully address the challenges discussed in the literature. For future work, it would be interesting to extend the algorithms to cover more complex patterns and combine them with lexical approaches
    corecore