3 research outputs found

    Un enfoque Multi-Objetivo a la optimización del Alineamiento Múltiple de Secuencias (MSA)

    Get PDF
    Multiple Sequence Alignment (MSA) is one of the main topics in the bioinformatics domain, consists in finding an optimal alignment for three or more biological sequences with the number maximum of conserved zones or totally aligned columns. Different scores to assess the quality of the alignments have been proposed, so the problem can be formulated and resolved as a Multi-Objective Optimization Problem (MOP). For this reason we have carried out a perfomanced study resolving the MSA problem under a multi-objective approach, considering two popular metrics as objectives to be optimized: The weighted Sum-Of-Pairs with affine gap penalties (wSOP) and the Totally Aligned Columns (TC), with three algorithms from the state-of- the-art of Multi-Objective Optimization: NSGAII, SPEA2 and MOCell. Our experiments reveals that the classic metaheuristic NSGA-II provides the best overall performance resolving some problems provided by the benchmark BAliBASE (v3.0), under a multi-objective and biological approach

    Metaheurísticas de optimización multiobjetivo aplicadas a la inferencia filogenética y al alineamiento múltiple de secuencias

    Get PDF
    Para la Inferencia Filogenética se implementó el algoritmo MORPHY, el cual provee funcionalidades únicas en el estado del arte, ya que además de inferir arboles filogenéticos multiobjetivo a partir de secuencias de ADN (nucleótidos), provee soporte para secuencias de proteínas (amino-ácidos). Para el problema del Alineamiento Múltiple de Secuencias se implementó M2Align, un algoritmo multiobjetivo que optimiza simultáneamente tres métricas de calidad en los alineamientos: información estructural de las proteínas, porcentaje de columnas totalmente alineadas y porcentaje de residuos; además reduce los tiempos y esfuerzos computacionales requeridos por otros optimizadores multiobjetivo, gracias a la explotación de las capacidades que ofrecen las arquitecturas modernas basadas en clúster de procesadores multi-núcleo y; en comparación con otras 9 herramientas clásicas y comúnmente usadas por los biólogos actualmente, permite obtener una mejor calidad de los alineamientos basada en las tres métricas definidas. Todas las implementaciones realizadas en esta investigación se encuentran disponibles en el repositorio público Github para su libre acceso y distribución. Estos trabajos han dado lugar a las siguientes publicaciones: tres artículos en revistas internacionales indexadas en el JCR, la primera, Methods in Ecology and Evolution de primer cuartil, en la que se publicó el framework MO-Phylogenetics, la segunda, International Journal of Intelligent Systems de segundo cuartil, en la que se publicó el análisis comparativo biobjetivo de algoritmos sobre el Alineamiento Múltiple de Secuencias, y la tercera en la revista Bioinformatics, en la que se publicó la propuesta algorítmica M2Align; un artículo en una revista internacional no indexada en el JCR llamada Progress in Artificial Intelligence, en el que se publicó el análisis algorítmico de una formulación de tres objetivos al problema del Alineamiento Múltiple de Secuencias y dos participaciones en congresos internacionales, la primera en el 5th International Work-Conference on Bioinformatics and Biomedical Engineering iWBBIO 2017 en la que se presentó el framework jMetalMSA y la segunda en el 7th European Symposium on Computational Intelligence and Mathematics ESCIM 2015 donde se presentó un estudio inicial de metaheurísticas multiobjetivo aplicadas al Alineamiento Múltiple de Secuencias.La temática sobre la que ha girado esta tesis doctoral ha sido la optimización de dos problemas del campo de la Bioinformática: la Inferencia Filogenética y al Alineamiento Múltiple de Secuencias usando metaheurísticas multiobjetivo. Se ha partido de una revisión inicial de los trabajos publicados sobre ambas temáticas, que nos ha permitido introducirnos en los temas biológicos específicos de cada problema. Una vez estudiado los detalles de ambos problemas, se desarrollaron dos frameworks de optimización para hacer frente a ambos problemas: MO-Phylogenetics para la Inferencia Filogenética y jMetalMSA para el Alineamiento Múltiple de Secuencias. Con ayuda de sus funcionalidades se realizaron estudios comparativos entre metaheurísticas multiobjetivo clásicas y modernas del estado del arte sobre formulaciones de dos y tres objetivos de ambos problemas, con el objetivo de conocer su rendimiento y capacidad de desarrollo. A partir de estos resultados se logró definir dos propuestas algorítmicas para cada problema, las cuales fueron implementados en ambos frameworks

    Parallel Niche Pareto AlineaGA – an Evolutionary Multiobjective approach on Multiple Sequence Alignment

    No full text
    Multiple sequence alignment is one of the most recurrent assignments in Bioinformatics. This method allows organizing a set of molecular sequences in order to expose their similarities and their differences. Although exact methods exist for solving this problem, their use is limited by the computing demands which are necessary for exploring such a large and complex search space. Genetic Algorithms are adaptive search methods which perform well in large and complex spaces. Parallel Genetic Algorithms, not only increase the speed up of the search, but also improve its efficiency, presenting results that are better than those provided by the sum of several sequential Genetic Algorithms. Although these methods are often used to optimize a single objective, they can also be used in multidimensional domains, finding all possible tradeoffs among multiple conflicting objectives. Parallel AlineaGA is an Evolutionary Algorithm which uses a Parallel Genetic Algorithm for performing multiple sequence alignment. We now present the Parallel Niche Pareto AlineaGA, a multiobjective version of Parallel AlineaGA.We compare the performance of both versions using eight BAliBASE datasets. We also measure up the quality of the obtained solutions with the ones achieved by T-Coffee and ClustalW2, allowing us to observe that our algorithm reaches for better solutions in the majority of the datasets
    corecore