294 research outputs found

    On the role of metaheuristic optimization in bioinformatics

    Get PDF
    Metaheuristic algorithms are employed to solve complex and large-scale optimization problems in many different fields, from transportation and smart cities to finance. This paper discusses how metaheuristic algorithms are being applied to solve different optimization problems in the area of bioinformatics. While the text provides references to many optimization problems in the area, it focuses on those that have attracted more interest from the optimization community. Among the problems analyzed, the paper discusses in more detail the molecular docking problem, the protein structure prediction, phylogenetic inference, and different string problems. In addition, references to other relevant optimization problems are also given, including those related to medical imaging or gene selection for classification. From the previous analysis, the paper generates insights on research opportunities for the Operations Research and Computer Science communities in the field of bioinformatics

    A novel approach based on multiobjective variable mesh optimization to Phylogenetics

    Get PDF
    One of the most relevant problems in Bioinformaticsand Computational Biology is the search and reconstruction ofthe most accurate phylogenetic tree that explains, as exactly aspossible, the evolutionary relationships among species from agiven dataset. Different criteria have been employed to evaluatethe accuracy of evolutionary hypothesis in order to guide a searchalgorithm towards the best tree. However, these criteria may leadto distinct phylogenies, which are often conflicting among them.Therefore, a multi-objective approach can be useful. In this work,we present a phylogenetic adaptation of a multiobjective variablemesh optimization algorithm for inferring phylogenies, to tacklethe phylogenetic inference problem according to two optimalitycriteria: maximum parsimony and maximum likelihood. Theaim of this approach is to propose a complementary view ofphylogenetics in order to generate a set of trade-off phylogenetictopologies that represent a consensus between both criteria.Experiments on four real nucleotide datasets show that ourproposal can achieve promising results, under both multiobjectiveand biological approaches, with regard to other classical andrecent multiobjective metaheuristics from the state-of-the-art. &nbsp

    Solving multiple sequence alignment problems by using a swarm intelligent optimization based approach

    Get PDF
    In this article, the alignment of multiple sequences is examined through swarm intelligence based an improved particle swarm optimization (PSO). A random heuristic technique for solving discrete optimization problems and realistic estimation was recently discovered in PSO. The PSO approach is a nature-inspired technique based on intelligence and swarm movement. Thus, each solution is encoded as “chromosomes” in the genetic algorithm (GA). Based on the optimization of the objective function, the fitness function is designed to maximize the suitable components of the sequence and reduce the unsuitable components of the sequence. The availability of a public benchmark data set such as the Bali base is seen as an assessment of the proposed system performance, with the potential for PSO to reveal problems in adapting to better performance. This proposed system is compared with few existing approaches such as deoxyribonucleic acid (DNA) or ribonucleic acid (RNA) alignment (DIALIGN), PILEUP8, hidden Markov model training (HMMT), rubber band technique-genetic algorithm (RBT-GA) and ML-PIMA. In many cases, the experimental results are well implemented in the proposed system compared to other existing approaches

    Multiobjective characteristic-based framework for very-large multiple sequence alignment

    Get PDF
    Rubio-Largo, Á., Vanneschi, L., Castelli, M., & Vega-Rodríguez, M. A. (2018). Multiobjective characteristic-based framework for very-large multiple sequence alignment. Applied Soft Computing Journal, 69, 719-736. [Advanced online publication on 27 June 2017]DOI: 10.1016/j.asoc.2017.06.022In the literature, we can find several heuristics for solving the multiple sequence alignment problem. The vast majority of them makes use of flags in order to modify certain alignment parameters; however, if no flags are used, the aligner will run with the default parameter configuration, which, often, is not the optimal one. In this work, we propose a framework that, depending on the biological characteristics of the input dataset, runs the aligner with the best parameter configuration found for another dataset that has similar biological characteristics, improving the accuracy and conservation of the obtained alignment. To train the framework, we use three well-known multiobjective evolutionary algorithms: NSGA-II, IBEA, and MOEA/D. Then, we perform a comparative study between several aligners proposed in the literature and the characteristic-based version of Kalign, MAFFT, and MUSCLE, when solving widely-used benchmarks (PREFAB v4.0 and SABmark v1.65) and very-large benchmarks with thousands of unaligned sequences (HomFam).authorsversionpublishe

    Soft Computing Techiniques for the Protein Folding Problem on High Performance Computing Architectures

    Get PDF
    The protein-folding problem has been extensively studied during the last fifty years. The understanding of the dynamics of global shape of a protein and the influence on its biological function can help us to discover new and more effective drugs to deal with diseases of pharmacological relevance. Different computational approaches have been developed by different researchers in order to foresee the threedimensional arrangement of atoms of proteins from their sequences. However, the computational complexity of this problem makes mandatory the search for new models, novel algorithmic strategies and hardware platforms that provide solutions in a reasonable time frame. We present in this revision work the past and last tendencies regarding protein folding simulations from both perspectives; hardware and software. Of particular interest to us are both the use of inexact solutions to this computationally hard problem as well as which hardware platforms have been used for running this kind of Soft Computing techniques.This work is jointly supported by the FundaciónSéneca (Agencia Regional de Ciencia y Tecnología, Región de Murcia) under grants 15290/PI/2010 and 18946/JLI/13, by the Spanish MEC and European Commission FEDER under grant with reference TEC2012-37945-C02-02 and TIN2012-31345, by the Nils Coordinated Mobility under grant 012-ABEL-CM-2014A, in part financed by the European Regional Development Fund (ERDF). We also thank NVIDIA for hardware donation within UCAM GPU educational and research centers.Ingeniería, Industria y Construcció

    Assembly sequence planning using hybrid binary particle swarm optimization

    Get PDF
    Assembly Sequence Planning (ASP) is known as a large-scale, timeconsuming combinatorial problem. Therefore time is the main factor in production planning. Recently, ASP in production planning had been studied widely especially to minimize the time and consequently reduce the cost. The first objective of this research is to formulate and analyse a mathematical model of the ASP problem. The second objective is to minimize the time of the ASP problem and hence reduce the product cost. A case study of a product consists of 19 components have been used in this research, and the fitness function of the problem had been calculated using Binary Particle Swarm Optimization (BPSO), and hybrid algorithm of BPSO and Differential Evolution (DE). The novel algorithm of BPSODE has been assessed with performance-evaluated criteria (performance measure). The algorithm has been validated using 8 comprehensive benchmark problems from the literature. The results show that the BPSO algorithm has an improved performance and can reduce further the time of assembly of the 19 parts of the ASP compared to the Simulated Annealing and Genetic Algorithm. The novel hybrid BPSODE algorithm shows a superior performance when assessed via performance-evaluated criteria compared to BPSO. The BPSODE algorithm also demonstrated a good generation of the recorded optimal value for the 8 standard benchmark problems

    Metaheurísticas de optimización multiobjetivo aplicadas a la inferencia filogenética y al alineamiento múltiple de secuencias

    Get PDF
    Para la Inferencia Filogenética se implementó el algoritmo MORPHY, el cual provee funcionalidades únicas en el estado del arte, ya que además de inferir arboles filogenéticos multiobjetivo a partir de secuencias de ADN (nucleótidos), provee soporte para secuencias de proteínas (amino-ácidos). Para el problema del Alineamiento Múltiple de Secuencias se implementó M2Align, un algoritmo multiobjetivo que optimiza simultáneamente tres métricas de calidad en los alineamientos: información estructural de las proteínas, porcentaje de columnas totalmente alineadas y porcentaje de residuos; además reduce los tiempos y esfuerzos computacionales requeridos por otros optimizadores multiobjetivo, gracias a la explotación de las capacidades que ofrecen las arquitecturas modernas basadas en clúster de procesadores multi-núcleo y; en comparación con otras 9 herramientas clásicas y comúnmente usadas por los biólogos actualmente, permite obtener una mejor calidad de los alineamientos basada en las tres métricas definidas. Todas las implementaciones realizadas en esta investigación se encuentran disponibles en el repositorio público Github para su libre acceso y distribución. Estos trabajos han dado lugar a las siguientes publicaciones: tres artículos en revistas internacionales indexadas en el JCR, la primera, Methods in Ecology and Evolution de primer cuartil, en la que se publicó el framework MO-Phylogenetics, la segunda, International Journal of Intelligent Systems de segundo cuartil, en la que se publicó el análisis comparativo biobjetivo de algoritmos sobre el Alineamiento Múltiple de Secuencias, y la tercera en la revista Bioinformatics, en la que se publicó la propuesta algorítmica M2Align; un artículo en una revista internacional no indexada en el JCR llamada Progress in Artificial Intelligence, en el que se publicó el análisis algorítmico de una formulación de tres objetivos al problema del Alineamiento Múltiple de Secuencias y dos participaciones en congresos internacionales, la primera en el 5th International Work-Conference on Bioinformatics and Biomedical Engineering iWBBIO 2017 en la que se presentó el framework jMetalMSA y la segunda en el 7th European Symposium on Computational Intelligence and Mathematics ESCIM 2015 donde se presentó un estudio inicial de metaheurísticas multiobjetivo aplicadas al Alineamiento Múltiple de Secuencias.La temática sobre la que ha girado esta tesis doctoral ha sido la optimización de dos problemas del campo de la Bioinformática: la Inferencia Filogenética y al Alineamiento Múltiple de Secuencias usando metaheurísticas multiobjetivo. Se ha partido de una revisión inicial de los trabajos publicados sobre ambas temáticas, que nos ha permitido introducirnos en los temas biológicos específicos de cada problema. Una vez estudiado los detalles de ambos problemas, se desarrollaron dos frameworks de optimización para hacer frente a ambos problemas: MO-Phylogenetics para la Inferencia Filogenética y jMetalMSA para el Alineamiento Múltiple de Secuencias. Con ayuda de sus funcionalidades se realizaron estudios comparativos entre metaheurísticas multiobjetivo clásicas y modernas del estado del arte sobre formulaciones de dos y tres objetivos de ambos problemas, con el objetivo de conocer su rendimiento y capacidad de desarrollo. A partir de estos resultados se logró definir dos propuestas algorítmicas para cada problema, las cuales fueron implementados en ambos frameworks

    On the Application of Multiobjective Optimization to Software Development Process and Antenna Designing

    Get PDF
    Esta tesis doctoral, presentada como compendio de artículos, explora los beneficios prácticos del uso combinado de la optimización multi-objetivo con aplicaciones de simulación. En esta tesis, con un caracter de aplicación, se aportan ideas prácticas sobre cómo combinar meta-heurísticas aplicadas a la optimización de problemas con herramientas y técnicas de simulación. La simulación permite estudiar problemas complejos antes de implementarlos en el mundo real. Los problemas de optimización son de los más complicados de resolver. Involucran 3 o más variables y en muchos casos no pueden ser resueltos matemáticamente. La simulación permite modelar el problema, pero son una ayuda insuficiente a la hora de encontrar las mejores soluciones a dicho problema. En estos casos, el trabajo conjunto de la herramienta de simulación con metaheurísticas de optimización permiten abordar estos problemas con costes computacionales razonables, obteniendo resultados muy cercanos al óptimo. Debe tenerse en cuenta que las soluciones de los problemas multiobjetivo contienen un conjunto de variables donde habitualmente mejorar (optimizar) una variable, suponga empeorar (hacer menos óptima) otra(s). Por tanto, lo deseable es encontrar un conjunto de soluciones donde cada variable se optimiza teniendo en cuenta el posible impacto negativo en el resto de variables. A ese conjunto de soluciones, se le suele conocer como el Frente de Pareto Óptimo. Esta tesis presenta dos problemas reales, complejos y pertenecientes a campos totalmente distintos, que han sido resueltos de forma existosa, aplicando la misma técnica: Simulación combinada con optimización multiobjetivo. Esta tesis comienza presentando un caso de técnicas de optimización multiobjetivo a través de la simulación para ayudar a los directores de proyectos de software a encontrar las mejores configuraciones para los proyectos basados ITIL (Information Technology Infrastructure Library), de manera que se optimicen las estimaciones de calendario para un proyecto determinado, el tiempo y la productividad. Los datos de gestión de proyectos pueden obtenerse mediante simulación, por ejemplo, para optimizar el número de recursos utilizados en cada fase de la vida del proyecto. También se presenta otro caso de estudio sobre la forma en que la optimización de la simulación puede ayudar en el diseño de cualquier tipo de antena. En este caso de estudio, el objetivo es lograr una antena helicoidal, de doble banda, lo más compacta posible, para la telemetría, el seguimiento y el control (TTC) de los satélites. En los satélites es esencial reducir el volumen y el peso de los dispositivos instalados, manteniendo al mismo tiempo los requisitos de funcionamiento. Adicionalmente, esta tesis realiza un aporte teórico proponiendo un nuevo algoritmo llamado MNDS (Merge Non-Dominated Sorting) que mejora el rendimiento de los algoritmos de optimización multi-objectivo basados en el cálculo del Pareto Front

    Enhanced Harris's Hawk algorithm for continuous multi-objective optimization problems

    Get PDF
    Multi-objective swarm intelligence-based (MOSI-based) metaheuristics were proposed to solve multi-objective optimization problems (MOPs) with conflicting objectives. Harris’s hawk multi-objective optimizer (HHMO) algorithm is a MOSIbased algorithm that was developed based on the reference point approach. The reference point is determined by the decision maker to guide the search process to a particular region in the true Pareto front. However, HHMO algorithm produces a poor approximation to the Pareto front because lack of information sharing in its population update strategy, equal division of convergence parameter and randomly generated initial population. A two-step enhanced non-dominated sorting HHMO (2SENDSHHMO) algorithm has been proposed to solve this problem. The algorithm includes (i) a population update strategy which improves the movement of hawks in the search space, (ii) a parameter adjusting strategy to control the transition between exploration and exploitation, and (iii) a population generating method in producing the initial candidate solutions. The population update strategy calculates a new position of hawks based on the flush-and-ambush technique of Harris’s hawks, and selects the best hawks based on the non-dominated sorting approach. The adjustment strategy enables the parameter to adaptively changed based on the state of the search space. The initial population is produced by generating quasi-random numbers using Rsequence followed by adapting the partial opposition-based learning concept to improve the diversity of the worst half in the population of hawks. The performance of the 2S-ENDSHHMO has been evaluated using 12 MOPs and three engineering MOPs. The obtained results were compared with the results of eight state-of-the-art multi-objective optimization algorithms. The 2S-ENDSHHMO algorithm was able to generate non-dominated solutions with greater convergence and diversity in solving most MOPs and showed a great ability in jumping out of local optima. This indicates the capability of the algorithm in exploring the search space. The 2S-ENDSHHMO algorithm can be used to improve the search process of other MOSI-based algorithms and can be applied to solve MOPs in applications such as structural design and signal processing

    Fine-grained parallelization of fitness functions in bioinformatics optimization problems: gene selection for cancer classification and biclustering of gene expression data

    Get PDF
    ANTECEDENTES: las metaheurísticas se utilizan ampliamente para resolver grandes problemas de optimización combinatoria en bioinformática debido al enorme conjunto de posibles soluciones. Dos problemas representativos son la selección de genes para la clasificación del cáncer y el agrupamiento de los datos de expresión génica. En la mayoría de los casos, estas metaheurísticas, así como otras técnicas no lineales, aplican una función de adecuación a cada solución posible con una población de tamaño limitado, y ese paso involucra latencias más altas que otras partes de los algoritmos, lo cual es la razón por la cual el tiempo de ejecución de las aplicaciones dependerá principalmente del tiempo de ejecución de la función de aptitud. Además, es habitual encontrar formulaciones aritméticas de punto flotante para las funciones de fitness. De esta manera, una paralelización cuidadosa de estas funciones utilizando la tecnología de hardware reconfigurable acelerará el cálculo, especialmente si se aplican en paralelo a varias soluciones de la población. RESULTADOS: una paralelización de grano fino de dos funciones de aptitud de punto flotante de diferentes complejidades y características involucradas en el biclustering de los datos de expresión génica y la selección de genes para la clasificación del cáncer permitió obtener mayores aceleraciones y cómputos de potencia reducida con respecto a los microprocesadores habituales. CONCLUSIONES: Los resultados muestran mejores rendimientos utilizando tecnología de hardware reconfigurable en lugar de los microprocesadores habituales, en términos de tiempo de consumo y consumo de energía, no solo debido a la paralelización de las operaciones aritméticas, sino también gracias a la evaluación de aptitud concurrente para varios individuos de la población en La metaheurística. Esta es una buena base para crear soluciones aceleradas y de bajo consumo de energía para escenarios informáticos intensivos.BACKGROUND: Metaheuristics are widely used to solve large combinatorial optimization problems in bioinformatics because of the huge set of possible solutions. Two representative problems are gene selection for cancer classification and biclustering of gene expression data. In most cases, these metaheuristics, as well as other non-linear techniques, apply a fitness function to each possible solution with a size-limited population, and that step involves higher latencies than other parts of the algorithms, which is the reason why the execution time of the applications will mainly depend on the execution time of the fitness function. In addition, it is usual to find floating-point arithmetic formulations for the fitness functions. This way, a careful parallelization of these functions using the reconfigurable hardware technology will accelerate the computation, specially if they are applied in parallel to several solutions of the population. RESULTS: A fine-grained parallelization of two floating-point fitness functions of different complexities and features involved in biclustering of gene expression data and gene selection for cancer classification allowed for obtaining higher speedups and power-reduced computation with regard to usual microprocessors. CONCLUSIONS: The results show better performances using reconfigurable hardware technology instead of usual microprocessors, in computing time and power consumption terms, not only because of the parallelization of the arithmetic operations, but also thanks to the concurrent fitness evaluation for several individuals of the population in the metaheuristic. This is a good basis for building accelerated and low-energy solutions for intensive computing scenarios.• Ministerio de Economía y Competitividad y Fondos FEDER. Contrato TIN2012-30685 (I+D+i) • Gobierno de Extremadura. Ayuda GR15011 para grupos TIC015 • CONICYT/FONDECYT/REGULAR/1160455. Beca para Ricardo Soto Guzmán • CONICYT/FONDECYT/REGULAR/1140897. Beca para Broderick CrawfordpeerReviewe
    corecore