5 research outputs found

    Using conceptual modeling to improve genome data management

    Full text link
    [EN] With advances in genomic sequencing technology, a large amount of data is publicly available for the research community to extract meaningful and reliable associations among risk genes and the mechanisms of disease. However, this exponential growth of data is spread in over thousand heterogeneous repositories, represented in multiple formats and with different levels of quality what hinders the differentiation of clinically valid relationships from those that are less well-sustained and that could lead to wrong diagnosis. This paper presents how conceptual models can play a key role to efficiently manage genomic data. These data must be accessible, informative and reliable enough to extract valuable knowledge in the context of the identification of evidence supporting the relationship between DNA variants and disease. The approach presented in this paper provides a solution that help researchers to organize, store and process information focusing only on the data that are relevant and minimizing the impact that the information overload has in clinical and research contexts. A case-study (epilepsy) is also presented, to demonstrate its application in a real context.Spanish State Research Agency and the Generalitat Valenciana under the projects TIN2016-80811-P and PROMETEO/2018/176; ERDF.Pastor López, O.; León-Palacio, A.; Reyes Román, JF.; García-Simón, A.; Casamayor Rodenas, JC. (2020). Using conceptual modeling to improve genome data management. Briefings in Bioinformatics. 22(1):45-54. https://doi.org/10.1093/bib/bbaa100S4554221McCombie, W. R., McPherson, J. D., & Mardis, E. R. (2018). Next-Generation Sequencing Technologies. Cold Spring Harbor Perspectives in Medicine, 9(11), a036798. doi:10.1101/cshperspect.a036798Condit, C. M., Achter, P. J., Lauer, I., & Sefcovic, E. (2001). The changing meanings of ?mutation:? A contextualized study of public discourse. Human Mutation, 19(1), 69-75. doi:10.1002/humu.10023Karki, R., Pandya, D., Elston, R. C., & Ferlini, C. (2015). Defining «mutation» and «polymorphism» in the era of personal genomics. BMC Medical Genomics, 8(1). doi:10.1186/s12920-015-0115-zHamid, J. S., Hu, P., Roslin, N. M., Ling, V., Greenwood, C. M. T., & Beyene, J. (2009). Data Integration in Genetics and Genomics: Methods and Challenges. Human Genomics and Proteomics, 1(1). doi:10.4061/2009/869093Baudhuin, L. M., Biesecker, L. G., Burke, W., Green, E. D., & Green, R. C. (2019). Predictive and Precision Medicine with Genomic Data. Clinical Chemistry, 66(1), 33-41. doi:10.1373/clinchem.2019.304345Amaral, G., & Guizzardi, G. (2019). On the Application of Ontological Patterns for Conceptual Modeling in Multidimensional Models. Lecture Notes in Computer Science, 215-231. doi:10.1007/978-3-030-28730-6_14Ashburner, M., Ball, C. A., Blake, J. A., Botstein, D., Butler, H., Cherry, J. M., … Sherlock, G. (2000). Gene Ontology: tool for the unification of biology. Nature Genetics, 25(1), 25-29. doi:10.1038/75556Eilbeck, K., Lewis, S. E., Mungall, C. J., Yandell, M., Stein, L., Durbin, R., & Ashburner, M. (2005). Genome Biology, 6(5), R44. doi:10.1186/gb-2005-6-5-r44Vihinen, M. (2013). Variation Ontology for annotation of variation effects and mechanisms. Genome Research, 24(2), 356-364. doi:10.1101/gr.157495.113Köhler, S., Carmody, L., Vasilevsky, N., Jacobsen, J. O. B., Danis, D., Gourdine, J.-P., … McMurry, J. A. (2018). Expansion of the Human Phenotype Ontology (HPO) knowledge base and resources. Nucleic Acids Research, 47(D1), D1018-D1027. doi:10.1093/nar/gky1105Proceedings of the Eleventh International Conference on Data Engineering. (1995). Proceedings of the Eleventh International Conference on Data Engineering. doi:10.1109/icde.1995.380416Okayama, T., Tamura, T., Gojobori, T., Tateno, Y., Ikeo, K., Miyazaki, S., … Sugawara, H. (1998). Formal design and implementation of an improved DDBJ DNA database with a new schema and object-oriented library. Bioinformatics, 14(6), 472-478. doi:10.1093/bioinformatics/14.6.472Medigue, C., Rechenmann, F., Danchin, A., & Viari, A. (1999). Imagene: an integrated computer environment for sequence annotation and analysis. Bioinformatics, 15(1), 2-15. doi:10.1093/bioinformatics/15.1.2Paton, N. W., Khan, S. A., Hayes, A., Moussouni, F., Brass, A., Eilbeck, K., … Oliver, S. G. (2000). Conceptual modelling of genomic information. Bioinformatics, 16(6), 548-557. doi:10.1093/bioinformatics/16.6.548Vihinen, M., Hancock, J. M., Maglott, D. R., Landrum, M. J., Schaafsma, G. C. P., & Taschner, P. (2016). Human Variome Project Quality Assessment Criteria for Variation Databases. Human Mutation, 37(6), 549-558. doi:10.1002/humu.22976Fleuren, W. W. M., & Alkema, W. (2015). Application of text mining in the biomedical domain. Methods, 74, 97-106. doi:10.1016/j.ymeth.2015.01.015Salzberg, S. L. (2007). Genome re-annotation: a wiki solution? Genome Biology, 8(1). doi:10.1186/gb-2007-8-1-102Rigden, D. J., & Fernández, X. M. (2018). The 26th annual Nucleic Acids Research database issue and Molecular Biology Database Collection. Nucleic Acids Research, 47(D1), D1-D7. doi:10.1093/nar/gky1267Reyes Román, J. F., García, A., Rueda, U., & Pastor, Ó. (2019). GenesLove.Me 2.0: Improving the Prioritization of Genetic Variations. Evaluation of Novel Approaches to Software Engineering, 314-333. doi:10.1007/978-3-030-22559-9_14Richards, S., Aziz, N., Bale, S., Bick, D., Das, S., … Rehm, H. L. (2015). Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine, 17(5), 405-423. doi:10.1038/gim.2015.30Kelly, M. A., Caleshu, C., Morales, A., Buchan, J., Wolf, Z., … Funke, B. (2018). Adaptation and validation of the ACMG/AMP variant classification framework for MYH7-associated inherited cardiomyopathies: recommendations by ClinGen’s Inherited Cardiomyopathy Expert Panel. Genetics in Medicine, 20(3), 351-359. doi:10.1038/gim.2017.21

    Del Esquema Conceptual al Mundo Real, una Base de Datos Genómica

    Full text link
    Existen muchas técnicas para el diseño y desarrollo de sistemas en la actualidad, sin embargo, el uso de técnicas de modelado conceptual esta siendo una práctica cada vez más común entre la ingeniera de software, ya que con esta técnica se proporciona una precisa descripción del dominio del problema, de tal forma que la obtención de modelos a diferentes niveles de abstracción determine el producto software final. Así pues el Modelado Conceptual consiste en entender y dominar dominio del problema y la conceptualización del conocimiento que se tiene sobre él, a un nivel abstracto antes de implementar una solución, permite que los ingenieros de software y los clientes de los sistemas trabajen al mismo nivel y que, además, exista un entendimiento sobre lo que se tiene que hacer y el producto que se obtendrá. El diseño de modelos conceptuales y llevarlos a aplicaciones reales es abordado a través de la ingeniera dirigida por Modelos MDE (Model-Driven Engineering). Estas técnicas de modelado conceptual han sido aplicadas en los últimos años a muchos dominios de sistemas de información como sistemas de negocios, sistemas médicos, sistemas financieros, etc., sin embargo, se desea llevar estas técnicas a niveles más extremos, a dominios más difíciles y desafiantes como lo es la interpretación del Genoma Humano, donde la ausencia del uso de las técnicas del modelado conceptual es notable, y la falta de conocimiento que se tiene sobre el dominio es poca. Los principales objetivos de aplicar el Modelado Conceptual a la interpretación del Genoma Humano son: 1. Modelar correctamente el conocimiento que se tiene sobre este dominio y 2. Construir un sistema de información basado en dicho modelo conceptual. El trabajo que se presenta en esta tesina se va a centra más en el segundo objetivo pues, tanto para la Genómica como para la Bioinformática es importante desarrollar sistemas de software de calidad que contribuyan a la interpretación e investigación en este dominio. El trabajo se ha desarrollado dentro del Centro de Investigación ProS (Métodos de Producción del Software) en concreto en la línea de investigación de Modelado Conceptual del Genoma y, junto con otras tesinas desarrolladas en el centro, tiene como objetivo diseñar una plataforma de base de datos que incluya toda la información relevante que se pueda encontrar en las distintas bases de datos existentes así como el desarrollo de aplicaciones que permita su explotación. Estos objetivos generales, se concretan en los siguientes subobjetivos: 1. Diseño de un Esquema Conceptual del Genoma Humano (ECGH) que represente todo el dominio del conocimiento. 2. Diseño de la base de datos relacional asociada mediante un proceso de transformación y refinamiento. 3. Análisis de las fuentes de datos existentes y más utilizadas por los biólogos. 4. Diseño de un prototipo de carga inicial que permita poblar la base de datos definida. 5. Implementación y puesta en marcha del prototipo. El trabajo que se presenta se ha centrado en los subobjetivos 2, 3 y 4.Eraso Schattka, LE. (2011). Del Esquema Conceptual al Mundo Real, una Base de Datos Genómica. http://hdl.handle.net/10251/11365Archivo delegad

    Sistema de información genómico: Extensión del módulo de carga e integración de información genómica

    Full text link
    [EN] Integrating genomic information of APC gene in genomic information system spreading the load module[ES] Integrar la información genómica del gen APC en el sistema de información genómico extendiendo el módulo de cargaGuerola Martínez, J. (2013). Sistema de información genómico: Extensión del módulo de carga e integración de información genómica. http://hdl.handle.net/10251/44661Archivo delegad

    Integración de bases de datos genómicas: una aproximación basada en modelado conceptual

    Full text link
    En esta tesis se ha presentado el diseño y desarrollo de un sistema de información genómica que integra datos procedentes de las fuentes que almacenan la información más relevante en el área.Martín Mayordomo, A. (2011). Integración de bases de datos genómicas: una aproximación basada en modelado conceptual. http://hdl.handle.net/10251/15897Archivo delegad

    DISEÑO Y DESARROLLO DE UN SISTEMA DE INFORMACIÓN GENÓMICA BASADO EN UN MODELO CONCEPTUAL HOLÍSTICO DEL GENOMA HUMANO

    Full text link
    Entender el genoma es un desafío de primer nivel, y esto se debe en gran parte a la gran cantidad de información existente en el dominio. Gracias a la aplicación de tecnologías NGS (Next-Generation Sequencing) se han generado enormes cantidades de datos -nuevos-, por lo que es fundamental construir estructuras que permitan organizar, procesar y explorar los datos con el fin de lograr un máximo provecho de la información y mejorar la comprensión del genoma humano. En este estudio se define un marco de trabajo centrado en el uso del Modelado Conceptual como estrategia esencial para la búsqueda de soluciones. En el campo médico este enfoque de desarrollo de software está ganando impulso por su impacto en el trabajo realizado por genetistas, laboratorios clínicos y bioinformáticos. Entender el genoma es un dominio de aplicación muy interesante debido a dos aspectos fundamentales: 1) en primer lugar, por las implicaciones sociológicas que supone plantearse la posibilidad de entender el lenguaje de la vida. 2) y, en segundo lugar, desde una perspectiva más práctica de aplicación en el ámbito clínico, debido a su repercusión en la generación de diagnósticos genómicos, los cuales juegan un papel importante dentro de la Medicina de Precisión. En esta Tesis Doctoral se propone utilizar un Modelo Conceptual del Genoma Humano (MCGH) como base fundamental para la generación de Sistemas de Información Genómicos (GeIS), con el objetivo de facilitar una conceptualización del dominio que permita i) alcanzar un conocimiento preciso del dominio y ii) ser capaces de llegar a una medicina de precisión (personalizada). Es importante resaltar que este Modelo Conceptual debe permanecer en constante crecimiento debido a los nuevos aportes que surgen en la comunidad científica. En este trabajo de investigación se presenta la evolución natural del modelo, así como un ejemplo de extensión del mismo, lo que permite comprobar su extensibilidad conservando su definición inicial. Además, se aplica el uso de una metodología (SILE) sistemática para la obtención de los datos desde los distintos repositorios genómicos, los cuales serán explotados a través herramientas software basadas en modelos conceptuales. Mediante el uso de este Modelo Conceptual holístico del Genoma Humano se busca comprender y mejorar el compromiso ontológico con el dominio -genómico-, y desarrollar Sistemas de Información Genómicos apoyados en Modelo Conceptuales para ayudar a la toma de decisiones en el entorno bioinformático.Understanding the genome is a first level challenge, and this is due in large part to a large amount of information in the domain. Thanks to the application of NGS (Next-Generation Sequencing) technologies, enormous amounts of -new- data have been generated, so it is essential to building structures that allow organizing, processing and exploring the data in order to obtain maximum benefit from the information and improve the understanding of the human genome. In this study we define a framework focused on the use of Conceptual Modeling as an essential strategy for finding solutions. In the medical field, this approach to software development is gaining momentum due to its impact on the work carried out by geneticists, clinical laboratories, and bioinformatics. Understanding the genome is a domain of very interesting application due to two fundamental aspects: 1) firstly, because of the sociological implications of considering the possibility of understanding the language of life. 2) secondly, from a more practical perspective of application in the clinical field, due to its repercussion in the generation of genomic diagnoses, which play an important role within Precision Medicine. In this PhD, it is proposed to use a Conceptual Model of the Human Genome (CMHG) as the fundamental basis for the generation of Genomic Information Systems (GeIS), with the aim of facilitating a conceptualization of the domain that allows i) to achieve a precise knowledge of the domain and ii) be able to increase and improve the adaptation of genomics in personalized medicine. It is important to highlight that this Conceptual Model must remain in constant growth due to the new contributions that arise in the scientific community. In this research work the natural evolution of the model is presented, as well as an example of its extension, which allows verifying its extensibility while preserving its initial definition. In addition, the use of a systematic methodology is applied to obtain the data from the different genomic repositories, which will be exploited through software tools based on conceptual models. Through the use of this Holistic Conceptual Model of the Human Genome, we seek to understand and improve the ontological commitment to the -genomic- domain, and develop GeIS supported in Conceptual Model to help decision making in the bioinformatic environment in order to provide better treatment to the patients.Entendre el genoma és un desafiament de primer nivell, i açò es deu en gran part a la gran quantitat d'informació existent en el domini. Gràcies a l'aplicació de tecnologies NGS (Next-Generation Sequencing) s'han generat enormes quantitats de dades - nous-, per la qual cosa és fonamental construir estructures que permeten organitzar, processar i explorar les dades a fi d'aconseguir un màxim profit de la informació i millorar la comprensió del genoma humà. En este estudi es definix un marc de treball centrat en l'ús del Modelatge Conceptual com a estratègia essencial per a la busca de solucions. En el camp mèdic este enfocament de desenvolupament de programari està guanyant impuls pel seu impacte en el treball realitzat per genetistes, laboratoris clínics i bioinformàtics. Entendre el genoma és un domini d'aplicació molt interessant a causa de dos aspectes fonamentals: 1) en primer lloc, per les implicacions sociològiques que suposa plantejar-se la possibilitat d'entendre el llenguatge de la vida. 2) i, en segon lloc, des d'una perspectiva més pràctica d'aplicació en l'àmbit clínic, a causa de la seua repercussió en la generació de diagnòstics genòmics, els quals juguen un paper important dins de la Medicina de Precisió. En esta Tesi Doctoral es proposa utilitzar un Model Conceptual del Genoma Humà (MCGH) com a base fonamental per a la generació de Sistemes d'Informació Genòmics (GeIS), amb l'objectiu de facilitar una conceptualització del domini que permeta i) aconseguir un coneixement precís del domini i ii) ser capaços d'arribar a una medicina de precisió (personalitzada). És important ressaltar que este Model Conceptual ha de romandre en constant creixement degut a les noves aportacions que sorgixen en la comunitat científica. En este treball d'investigació es presenta l'evolució natural del model, així com un exemple d'extensió del mateix, la qual cosa permet comprovar la seua extensibilitat conservant la seua definició inicial. A més, s'aplica l'ús d'una metodologia (SILE) sistemàtica per a l'obtenció de les dades des dels distints reposadors genòmics, els quals seran explotats a través ferramentes de programari basades en models conceptuals. Per mitjà de l'ús d'este Model Conceptual holístic del Genoma Humà es busca comprendre i millorar el compromís ontològic amb el domini -genòmic-, i desenvolupar Sistemes d'Informació Genòmics recolzats en Model Conceptuals per ajudar a la presa de decisions en l'entorn bioinformàtic.Reyes Román, JF. (2018). DISEÑO Y DESARROLLO DE UN SISTEMA DE INFORMACIÓN GENÓMICA BASADO EN UN MODELO CONCEPTUAL HOLÍSTICO DEL GENOMA HUMANO [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/99565TESI
    corecore