2 research outputs found

    Formal methods applied to the analysis of phylogenies: Phylogenetic model checking

    Get PDF
    Los 谩rboles filogen茅ticos son abstracciones 煤tiles para modelar y caracterizar la evoluci贸n de un conjunto de especies o poblaciones respecto del tiempo. La proposici贸n, verificaci贸n y generalizaci贸n de hip贸tesis sobre un 谩rbol filogen茅tico inferido juegan un papel importante en el estudio y comprensi贸n de las relaciones evolutivas. Actualmente, uno de los principales objetivos cient铆ficos es extraer o descubrir los mensajes biol贸gicos impl铆citos y las propiedades estructurales subyacentes en la filogenia. Por ejemplo, la integraci贸n de informaci贸n gen茅tica en una filogenia ayuda al descubrimiento de genes conservados en todo o parte del 谩rbol, la identificaci贸n de posiciones covariantes en el ADN o la estimaci贸n de las fechas de divergencia entre especies. Consecuentemente, los 谩rboles ayudan a comprender el mecanismo que gobierna la deriva evolutiva. Hoy en d铆a, el amplio espectro de m茅todos y herramientas heterog茅neas para el an谩lisis de filogenias enturbia y dificulta su utilizaci贸n, adem谩s del fuerte acoplamiento entre la especificaci贸n de propiedades y los algoritmos utilizados para su evaluaci贸n (principalmente scripts ad hoc). Este problema es el punto de arranque de esta tesis, donde se analiza como soluci贸n la posibilidad de introducir un entorno formal de verificaci贸n de hip贸tesis que, de manera autom谩tica y modular, estudie la veracidad de dichas propiedades definidas en un lenguaje gen茅rico e independiente (en una l贸gica formal asociada) sobre uno de los m煤ltiples softwares preparados para ello. La contribuci贸n principal de la tesis es la propuesta de un marco formal para la descripci贸n, verificaci贸n y manipulaci贸n de relaciones causales entre especies de forma independiente del c贸digo utilizado para su valoraci贸n. Para ello, exploramos las caracter铆sticas de las t茅cnicas de model checking, un paradigma en el que una especificaci贸n expresada en l贸gica temporal se verifica con respecto a un modelo del sistema que representa una implementaci贸n a un cierto nivel de detalle. Se ha aplicado satisfactoriamente en la industria para el modelado de sistemas y su verificaci贸n, emergiendo del 谩mbito de las ciencias de la computaci贸n. Las contribuciones concretas de la tesis han sido: A) La identificaci贸n e interpretaci贸n de los 谩rboles filogeneticos como modelos de la evoluci贸n, adaptados al entorno de las t茅cnicas de model checking. B) La definici贸n de una l贸gica temporal que captura las propiedades filogen茅ticas habituales junto con un m茅todo de construcci贸n de propiedades. C) La clasificaci贸n de propiedades filogen茅ticas, identificando categor铆as de propiedades seg煤n est茅n centradas en la estructura del 谩rbol, en las secuencias o sean h铆bridas. D) La extensi贸n de las l贸gicas y modelos para contemplar propiedades cuantitativas de tiempo, probabilidad y de distancias. E) El desarrollo de un entorno para la verificaci贸n de propiedades booleanas, cuantitativas y param茅tricas. F) El establecimiento de los principios para la manipulaci贸n simbolica de objetos filogen茅ticos, p. ej., clados. G) La explotaci贸n de las herramientas de model checking existentes, detectando sus problemas y carencias en el campo de filogenia y proponiendo mejoras. H) El desarrollo de t茅cnicas "ad hoc" para obtener ganancia de complejidad alrededor de dos frentes: distribuci贸n de los c谩lculos y datos, y el uso de sistemas de informaci贸n. Los puntos A-F se centran en las aportaciones conceptuales de nuestra aproximaci贸n, mientras que los puntos G-H enfatizan la parte de herramientas e implementaci贸n. Los contenidos de la tesis est谩n contrastados por la comunidad cient铆fica mediante las siguientes publicaciones en conferencias y revistas internacionales. La introducci贸n de model checking como entorno formal para analizar propiedades biol贸gicas (puntos A-C) ha llevado a la publicaci贸n de nuestro primer art铆culo de congreso [1]. En [2], desarrollamos la verificaci贸n de hip贸tesis filogen茅ticas sobre un 谩rbol de ejemplo construido a partir de las relaciones impuestas por un conjunto de prote铆nas codificadas por el ADN mitocondrial humano (ADNmt). En ese ejemplo, usamos una herramienta autom谩tica y gen茅rica de model checking (punto G). El art铆culo de revista [7] resume lo b谩sico de los art铆culos de congreso previos y extiende la aplicaci贸n de l贸gicas temporales a propiedades filogen茅ticas no consideradas hasta ahora. Los art铆culos citados aqu铆 engloban los contenidos presentados en las Parte I--II de la tesis. El enorme tama帽o de los 谩rboles y la considerable cantidad de informaci贸n asociada a los estados (p.ej., la cadena de ADN) obligan a la introducci贸n de adaptaciones especiales en las herramientas de model checking para mantener un rendimiento razonable en la verificaci贸n de propiedades y aliviar tambi茅n el problema de la explosi贸n de estados (puntos G-H). El art铆culo de congreso [3] presenta las ventajas de rebanar el ADN asociado a los estados, la partici贸n de la filogenia en peque帽os sub谩rboles y su distribuci贸n entre varias m谩quinas. Adem谩s, la idea original del model checking rebanado se complementa con la inclusi贸n de una base de datos externa para el almacenamiento de secuencias. El art铆culo de revista [4] re煤ne las nociones introducidas en [3] junto con la implementaci贸n y resultados preliminares presentados [5]. Este tema se corresponde con lo presentado en la Parte III de la tesis. Para terminar, la tesis reaprovecha las extensiones de las l贸gicas temporales con tiempo expl铆cito y probabilidades a fin de manipular e interrogar al 谩rbol sobre informaci贸n cuantitativa. El art铆culo de congreso [6] ejemplifica la necesidad de introducir probabilidades y tiempo discreto para el an谩lisis filogen茅tico de un fenotipo real, en este caso, el ratio de distribuci贸n de la intolerancia a la lactosa entre diversas poblaciones arraigadas en las hojas de la filogenia. Esto se corresponde con el Cap铆tulo 13, que queda englobado dentro de las Partes IV--V. Las Partes IV--V completan los conceptos presentados en ese art铆culo de conferencia hacia otros dominios de aplicaci贸n, como la puntuaci贸n de 谩rboles, y tiempo continuo (puntos E-F). La introducci贸n de par谩metros en las hip贸tesis filogen茅ticas se plantea como trabajo futuro. Referencias [1] Roberto Blanco, Gregorio de Miguel Casado, Jos茅 Ignacio Requeno, and Jos茅 Manuel Colom. Temporal logics for phylogenetic analysis via model checking. In Proceedings IEEE International Workshop on Mining and Management of Biological and Health Data, pages 152-157. IEEE, 2010. [2] Jos茅 Ignacio Requeno, Roberto Blanco, Gregorio de Miguel Casado, and Jos茅 Manuel Colom. Phylogenetic analysis using an SMV tool. In Miguel P. Rocha, Juan M. Corchado Rodr铆guez, Florentino Fdez-Riverola, and Alfonso Valencia, editors, Proceedings 5th International Conference on Practical Applications of Computational Biology and Bioinformatics, volume 93 of Advances in Intelligent and Soft Computing, pages 167-174. Springer, Berlin, 2011. [3] Jos茅 Ignacio Requeno, Roberto Blanco, Gregorio de Miguel Casado, and Jos茅 Manuel Colom. Sliced model checking for phylogenetic analysis. In Miguel P. Rocha, Nicholas Luscombe, Florentino Fdez-Riverola, and Juan M. Corchado Rodr铆guez, editors, Proocedings 6th International Conference on Practical Applications of Computational Biology and Bioinformatics, volume 154 of Advances in Intelligent and Soft Computing, pages 95-103. Springer, Berlin, 2012. [4] Jos茅 Ignacio Requeno and Jos茅 Manuel Colom. Model checking software for phylogenetic trees using distribution and database methods. Journal of Integrative Bioinformatics, 10(3):229-233, 2013. [5] Jos茅 Ignacio Requeno and Jos茅 Manuel Colom. Speeding up phylogenetic model checking. In Mohd Saberi Mohamad, Loris Nanni, Miguel P. Rocha, and Florentino Fdez-Riverola, editors, Proceedings 7th International Conference on Practical Applications of Computational Biology and Bioinformatics, volume 222 of Advances in Intelligent Systems and Computing, pages 119-126. Springer, Berlin, 2013. [6] Jos茅 Ignacio Requeno and Jos茅 Manuel Colom. Timed and probabilistic model checking over phylogenetic trees. In Miguel P. Rocha et al., editors, Proceedings 8th International Conference on Practical Applications of Computational Biology and Bioinformatics, Advances in Intelligent and Soft Computing. Springer, Berlin, 2014. [7] Jos茅 Ignacio Requeno, Gregorio de Miguel Casado, Roberto Blanco, and Jos茅 Manuel Colom. Temporal logics for phylogenetic analysis via model checking. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 10(4):1058-1070, 2013
    corecore