12 research outputs found

    PACE Solver Description: Hust-Solver - A Heuristic Algorithm of Directed Feedback Vertex Set Problem

    Get PDF
    A directed graph is formed by vertices and arcs from one vertex to another. The feedback vertex set problem (FVSP) consists in making a given directed graph acyclic by removing as few vertices as possible. In this write-up, we outline the core techniques used in the heuristic feedback vertex set algorithm, submitted to the heuristic track of the 2022 PACE challenge

    Min (A)cyclic Feedback Vertex Sets and Min Ones Monotone 3-SAT

    Full text link
    In directed graphs, we investigate the problems of finding: 1) a minimum feedback vertex set (also called the Feedback Vertex Set problem, or MFVS), 2) a feedback vertex set inducing an acyclic graph (also called the Vertex 2-Coloring without Monochromatic Cycles problem, or Acyclic FVS) and 3) a minimum feedback vertex set inducing an acyclic graph (Acyclic MFVS). We show that these problems are strongly related to (variants of) Monotone 3-SAT and Monotone NAE 3-SAT, where monotone means that all literals are in positive form. As a consequence, we deduce several NP-completeness results on restricted versions of these problems. In particular, we define the 2-Choice version of an optimization problem to be its restriction where the optimum value is known to be either D or D+1 for some integer D, and the problem is reduced to decide which of D or D+1 is the optimum value. We show that the 2-Choice versions of MFVS, Acyclic MFVS, Min Ones Monotone 3-SAT and Min Ones Monotone NAE 3-SAT are NP-complete. The two latter problems are the variants of Monotone 3-SAT and respectively Monotone NAE 3-SAT requiring that the truth assignment minimize the number of variables set to true. Finally, we propose two classes of directed graphs for which Acyclic FVS is polynomially solvable, namely flow reducible graphs (for which MFVS is already known to be polynomially solvable) and C1P-digraphs (defined by an adjacency matrix with the Consecutive Ones Property)

    Graphical Requirements for Multistationarity in Reaction Networks and their Verification in BioModels

    Get PDF
    International audienceThomas's necessary conditions for the existence of multiple steady states in gene networks have been proved by Soulé with high generality for dynamical systems defined by differential equations. When applied to (protein) reaction networks however, those conditions do not provide information since they are trivially satisfied as soon as there is a bimolecular or a reversible reaction. Refined graphical requirements have been proposed to deal with such cases. In this paper, we present for the first time a graph rewriting algorithm for checking the refined conditions given by Soliman, and evaluate its practical performance by applying it systematically to the curated branch of the BioModels repository. This algorithm analyzes all reaction networks (of size up to 430 species) in less than 0.05 second per network, and permits to conclude to the absence of multistationarity in 160 networks over 506. The short computation times obtained in this graphical approach are in sharp contrast to the Jacobian-based symbolic computation approach. We also discuss the case of one extra graphical condition by arc rewiring that allows us to conclude on 20 more networks of this benchmark but with a high computational cost. Finally, we study with some details the case of phosphorylation cycles and MAPK signalling models which show the importance of modelling the intermediate complexations with the enzymes in order to correctly analyze the multistationarity capabilities of such biochemical reaction networks

    Multiple genome alignment for identifying the core structure among moderately related microbial genomes

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>Identifying the set of intrinsically conserved genes, or the genomic core, among related genomes is crucial for understanding prokaryotic genomes where horizontal gene transfers are common. Although core genome identification appears to be obvious among very closely related genomes, it becomes more difficult when more distantly related genomes are compared. Here, we consider the core structure as a set of sufficiently long segments in which gene orders are conserved so that they are likely to have been inherited mainly through vertical transfer, and developed a method for identifying the core structure by finding the order of pre-identified orthologous groups (OGs) that maximally retains the conserved gene orders.</p> <p>Results</p> <p>The method was applied to genome comparisons of two well-characterized families, <it>Bacillaceae </it>and <it>Enterobacteriaceae</it>, and identified their core structures comprising 1438 and 2125 OGs, respectively. The core sets contained most of the essential genes and their related genes, which were primarily included in the intersection of the two core sets comprising around 700 OGs. The definition of the genomic core based on gene order conservation was demonstrated to be more robust than the simpler approach based only on gene conservation. We also investigated the core structures in terms of G+C content homogeneity and phylogenetic congruence, and found that the core genes primarily exhibited the expected characteristic, <it>i.e</it>., being indigenous and sharing the same history, more than the non-core genes.</p> <p>Conclusion</p> <p>The results demonstrate that our strategy of genome alignment based on gene order conservation can provide an effective approach to identify the genomic core among moderately related microbial genomes.</p

    Markov-Chain-Based Heuristics for the Feedback Vertex Set Problem for Digraphs

    Get PDF
    A feedback vertex set (FVS) of an undirected or directed graph G=(V, A) is a set F such that G-F is acyclic. The minimum feedback vertex set problem asks for a FVS of G of minimum cardinality whereas the weighted minimum feedback vertex set problem consists of determining a FVS F of minimum weight w(F) given a real-valued weight function w. Both problems are NP-hard [Karp72]. Nethertheless, they have been found to have applications in many fields. So one is naturally interested in approximation algorithms. While most of the existing approximation algorithms for feedback vertex set problems rely on local properties of G only, this thesis explores strategies that use global information about G in order to determine good solutions. The pioneering work in this direction has been initiated by Speckenmeyer [Speckenmeyer89]. He demonstrated the use of Markov chains for determining low cardinality FVSs. Based on his ideas, new approximation algorithms are developed for both the unweighted and the weighted minimum feedback vertex set problem for digraphs. According to the experimental results presented in this thesis, these new algorithms outperform all other existing approximation algorithms. An additional contribution, not related to Markov chains, is the identification of a new class of digraphs G=(V, A) which permit the determination of an optimum FVS in time O(|V|^4). This class strictly encompasses the completely contractible graphs [Levy/Low88]

    Nouveaux résultats sur les arbres, forêts et forêts linéaires maximum ainsi que sur la distance moyenne dans un graphe.

    Get PDF
    RÉSUMÉ Cette thèse s’inscrit dans le domaine de la recherche scientifique assistée par l’ordinateur. Ce domaine est en pleine expansion depuis quelques années grâce aux récents développements des systèmes informatiques. En théorie des graphes plusieurs systèmes ont été développés afin de générer de nouvelles conjectures entre les différents invariants d’un graphe. Nous citons par exemple les systèmes AutoGraphiX, Graffiti et GraPHedron. Après un premier chapitre consacré à l’introduction, nous proposons dans le deuxième chapitre une revue de littérature sur les théorèmes connus ainsi que les conjectures qui bornent inférieurement ou supérieurement des invariants de graphe. Notre intérêt porte essentiellement sur la cardinalité des sous-graphes induits par un bistable, une forêt, une forêt linéaire et un arbre. Rappelons que ces problèmes sont NP-complets. Fajtlowicz a posé, respectivement pendant les années 1986 et 1992, les conjectures suivantes (générées par Graffiti et listées, parmi plusieurs, dans le document Written on the Wall): μ(G) ≤ α(G) (WoW 2) et μ(G) ≤ α2(G)/2 (WoW 747). Où μ(G) dénote la distance moyenne d’un graphe connexe, α(G) le nombre de stabilité et α2(G) la cardinalité du plus grand sous-graphe biparti induit. Il est clair que la deuxième conjecture est plus forte que la première, qui a été prouvée par Chung. Une autre preuve de la première conjecture a été proposée par Dankelmann, qui a aussi donné une description du graphe G qui maximise la distance moyenne pour un ordre donné et une valeur de α(G) donnée.----------ABSTRACT There are many discovery systems in graph theory that have been designed to generate new conjectures and explore graphs. For instance the systems AutoGraphiX, Graffiti and GraPHedron. After the introduction, we present in the second chapter a survey on theorems and conjectures that give bounds on some graph invariants. We are concerned by the order of a largest induced subgraph (bipartite, forest, linear forest, tree). We recall that these problems are NP-hard. With the help of the Graffiti system, Fajtlowicz conjectured around 1992 [36] that the average distance between two vertices of a connected graph G is at most half the maximum order of an induced bipartite subgraph of G, denoted α2(G). We prove in the third chapter a strengthening of this conjecture by showing that the average distance between two vertices of a connected graph G is at most half the maximum order of an induced forest, denoted F(G). It is the main result of this thesis. Finally, we conjecture that the average distance between two vertices of a connected graph is at most half the maximum order of an induced linear forest (where a linear forest is a union of paths). Moreover, we characterize the graphs maximizing the average distance among all graphs G having a fixed number of vertices and a fixed value of F(G) or α2(G)

    Étude et séparation des inégalités valides pour des problèmes de partitionnement et de couverture

    Get PDF
    RÉSUMÉ : Cette thèse s'intéresse aux inégalités valides et leurs algorithmes de séparation pour les problèmes de partitionnement et de couverture suivants : le problème d'horaires de véhicules avec plusieurs dépôts (Multiple Depot Vehicle Scheduling Problem, MDVSP), le problème de partitionnement d'ensemble (Set Partitioning Problem, SPP) et le problème du transversal de circuits de cardinalité minimale (MINimum cardinality Feedback Vertex Set problem, MIFVS). Notons que les inégalités valides introduites sont aussi applicables à d'autres problèmes ayant des structures similaires aux problèmes étudiés. Dans la première partie de cette thèse, nous présentons un algorithme combinant la méthode d'élimination de variables, la méthode de séparation et évaluation progressive et la méthode de génération de plans coupants pour la résolution du MDVSP. Nous utilisons la formulation mathématique de multi-flot dans les réseaux, proposée par Ribeiro et Soumis (1994). Pour réduire la taille du problème nous débutons par l'application de la méthode d'élimination de variables. Dans la première phase, nous appliquons une proposition énoncée par Nemhauser et Wosley (1988) et dans la deuxième phase, nous utilisons le principe introduit par Irnich et al.(2010) mais sans génération de colonnes. Ensuite, afin d'améliorer la valeur de la borne inférieure, nous décrivons une méthode de génération de plans coupants. Cette dernière est basée sur une généralisation des inégalités valides introduites par Hadjar et al. (2006). Pour séparer ces inégalités valides, nous proposons d'identifier deux structures particulières propres au MDVSP. Par la suite, nous comparons la performance de différentes stratégies de notre algorithme à l'aide des instances générées aléatoirement. Finalement, nous concluons qu'en général notre algorithme est meilleur que le solveur commercial CPLEX. La première méthode de séparation proposée pour identifier la première structure, que nous nommons structure de cycle impair conflictuel, utilise la similitude entre le problème du stable et le MDVSP. Notre méthode consiste à construire un graphe de conflit à l'aide d'un sous-ensemble d'arcs possédant certaines propriétés dans le multigraphe représentant le MDVSP. Nous prouvons qu'un trou impair dans le graphe de conflit correspond à un cycle impair conflictuel dans le multigraphe du MDVSP. Afin d'identifier les trous impairs nous adaptons l'algorithme proposé par Nemhauser et Sigismondi (1992). En outre, nous démontrons que chaque cycle impair conflictuel permet d'obtenir une inégalité valide violée par la solution fractionnaire courante. Afin d'enrichir ces inégalités, nous décrivons une procédure de liftage. La deuxième méthode de séparation proposée pour identifier la deuxième structure, que nous nommons structure de coupe impaire, exploite la ressemblance entre le problème de couplage et le MDVSP et, par conséquent, entre les inégalités valides du MDVSP et les inégalités d'Edmonds (1965). La relation entre les deux problèmes est basée sur le principe de conflit, pour le problème de couplage, deux arêtes adjacentes sont toujours en conflit et pour le MDVSP deux sous-chemins adjacents peuvent être en conflit s'ils ont la même source ou le même puits ou s'ils sont de couleurs différentes), donc si nous remplaçons un sous-chemin par une arête, alors les inégalités d'Edmonds engendrent des inégalités valides du MDVSP. Afin d'identifier des structures de coupes impaires, nous construisons un graphe de chemins réguliers, où un chemin régulier est une suite d'arcs de même couleur. Ensuite, nous formulons le problème de séparation comme un programme linéaire en nombres entiers et nous prouvons que certaines solutions entières de ce dernier nous permettent d'identifier des inégalités de coupe impaire. Afin de l'enrichir, nous proposons une procédure de liftage. Nous démontrons que chaque coupe impaire liftée correspond à une inégalité valide pour le MDVSP. Dans la deuxième partie de cette thèse, nous proposons la résolution du problème de partitionnement d'ensemble par une méthode combinant la méthode de séparation et évaluation progressive et la méthode de génération de plans coupants. Notons que nous nous intéressons au problème de partitionnement pur. Nous introduisons deux nouvelles classes d'inégalités valides: nommées les inégalités de type I et de type II, pour le problème de partitionnement. En outre, nous formulons le problème de séparation de chaque classe d'inégalités valides comme un programme linéaire en nombres entiers et nous montrons que certaines solutions entières de ce dernier permettent d'identifier des inégalités valides pour le problème de partitionnement. Ensuite, nous proposons de séparer les inégalités de clique en résolvant un autre problème auxiliaire en nombres entiers. Enfin, nous analysons l'efficacité de notre algorithme en utilisant quelques instances de Hoffman et Padberg (1993) et d'autres générées aléatoirement à l'aide du générateur proposé par Lewis et al. (2008). Finalement, nous concluons que notre algorithme est plus efficace que CPLEX lorsque la densité du problème à résoudre est supérieure à 16% et ne l'est pas dans le cas contraire. Dans la dernière partie de cette thèse, nous présentons une méthode combinant la génération de contraintes et des plans coupants afin de résoudre une variante du problème de transversal de circuits de cardinalité minimale. Ce dernier est relié à l'analyse des dictionnaires des langues naturelles. Nous nous intéressons à un des problèmes de linguistique qui consiste à déterminer le nombre minimum de mots à connaître pour comprendre toutes les définitions d'un dictionnaire donné. Ce problème est formulé comme un problème de transversal de circuits de cardinalité minimale. Nous décrivons des méthodes de séparation de trois classes d'inégalités valides : deux classes particulières des inégalités de Chvátal-Gomory et les inégalités de clique de cardinalité 3. Nous formulons le problème de séparation de chaque classe comme un programme linéaire en nombres entiers et nous démontrons que certaines solutions entières permettent d'identifier des inégalités valides pour le problème à résoudre. Enfin, nous présentons et nous analysons les résultats des tests effectués à l'aide des exemplaires extraits de dictionnaires de langue anglaise. Malheureusement, les résultats obtenus ne sont pas concluants étant donné que pour certaines instances nous n'avons pas réussi à trouver les solutions optimales en utilisant le solveur commercial, ni à prouver l'optimalité en utilisant notre algorithme. Néanmoins, nous constatons que l'ajout des inégalités valides permet de trouver de meilleures solutions réalisables dans le temps limite imparti et dans certains cas à trouver la solution optimale. Les travaux présentés dans cette thèse constituent une démarche basée sur les caractéristiques du problème à résoudre. Notre objectif est de présenter de nouveaux algorithmes efficaces pour la séparation des inégalités valides, permettant l'amélioration de la valeur de la relaxation linéaire, mais « bien qu'on ait du cœur à l'ouvrage, l'art est long et le temps est court ». (Charles Baudelaire, Les fleurs du mal).----------ABSTRACT : In this thesis, we study valid inequalities and we propose branch-and-cut algorithms for some classical problems such as : the Multiple Depot Vehicle Scheduling Problem (MDVSP), the Set Partitioning Problem (SPP) and the MINimum cardinality Feedback Set problem (MINFVS). In the first part of this thesis, we present an algorithm combining branch-and-bound, cutting planes and variable fixing to solve the MDVSP. We use the multicommodity flow model of the MDVSP, proposed by Reibero and Soumis (1994). In the first step, we apply a proposition to fix the variables that was introduced by Nemhauser and Wosley (1988) and used by Hadjar et al. (2006). In order to eliminate more variables, we use the same rule as Irnich et al.(2010) but without column generation. In the second step, we describe a method for separating the valid inequalities introduced by Hadjar et al. (2006) and generalized in the present work. Our method identifies two special structures corresponding to valid inequalities. Then we present the results of computational experiments comparing the performance of several strategies using the random instances. We conclude that our algorithm is better than the commercial software. The separation procedure that we propose to identify the first structure, called odd conflictual cycle, uses the similarity between the MDVSP and the stable set problem. We start by creating a conflict graph of the multigraph representing the MDVSP, we consider only the arcs in conflict. Then we prove that each odd hole in this conflict graph is an odd conflictual cycle in the multigraph representing the MDVSP. In order to identify odd holes we adopt the polynomial algorithm proposed by Nemhauser and Sigismondi (1992). Moreover we prove that every odd conflictual cycle identifies a valid inequality violated by the fractional solution. We also present a lifting procedure in order to enrich the valid inequalities. The separation procedure that we present to identify the second structure, called odd set, uses the relationship between the MDVSP and the matching problem, consequently the relationship between the valid inequalities for the MDVSP and the blossom inequalities introduced by Edmonds (1965). In the matching problem two adjacent edges are always in conflict and for the MDVSP two adjacent subpaths may be in conflict (if they are the same source or the same sink or of different colours). In order to identify the odd set, we use the regular path graph, where a regular path is a sequence of the arcs with the same colour. Then we formulate the separation problem as an integer program and we prove that each integer solution identifies, under certain conditions, an odd set. In addition, we present a lifting procedure and we prove that each inequality obtained by lifted odd set is a valid inequality for the MDVSP. In the second part of this thesis, we propose an algorithm combining branch-and-bound and the cutting planes method to solve the set partitioning problem. Note that we are interested in the pure partitioning problem. We derive new classes of valid inequalities for the problem. Moreover, we present a separation procedure for each class by solving an auxiliary integer program using a fractional solution of the set partitioning problem. Then we prove that each integer solution of this program, under certain conditions, is a valid inequality for the problem. We lift this inequality with variables of value 00. Also we propose to separate a clique inequality by using another auxiliary integer program and we prove that each integer solution of this program, under certain conditions, is a clique inequality for the set partitioning problem. Finally, we present the results of a computational study and we compare our results with the commercial software. Note that we use instances of Hoffman and Padberg (1993) and other randomly generated instances using the generator proposed by Lewis et al. (2008). We conclude that our algorithm is better than the commercial software when the density of the problem is greater than 16% and is not otherwise. In the last part of this thesis, we present a method combining constraint generation and cutting planes generation in order to solve a class of feedback vertex set problem arising in the analysis of the natural language dictionaries. A dictionary is a set of definitions, where a definition consist of one or several sentences represented by the sequence of words. We are interested in the linguistic problem of determining the minimum number of words to know in order to understand all definitions in the dictionary. We propose to separate two classes of Chvátal-Gomory inequalities and clique inequalities of cardinality 3 by solving an auxiliary integer program for each of them. Also we prove that each integer solution of the auxiliary program identifies a valid inequality for the feedback vertex set problem. Finally we present and analyze the resultats of computational experiments using the dictionaries of the English language are available on the Word Wide Web. Unfortunately, the results are not conclusive because we are not able to find optimal solution using a solver commercial or prove optimality using our algorithm. However, we observe that adding the valid inequalities permits to find better feasibles solutions within the time limit prescribed. The work presented in this thesis is an approach based on the characteristics of the problem. Our objective is to present new efficient algorithms for the separation of valid inequalities in order to improve the value of the linear relaxation

    Évolution des génomes par mutations locales et globales : une approche d’alignement

    Get PDF
    Durant leur évolution, les génomes accumulent des mutations pouvant affecter d’un nucléotide à plusieurs gènes. Les modifications au niveau du nombre et de l’organisation des gènes dans les génomes sont dues à des mutations globales, telles que les duplications, les pertes et les réarrangements. En comparant les ordres de gènes des génomes, il est possible d’inférer les événements évolutifs les plus fréquents, le contenu en gènes des espèces ancestrales ainsi que les histoires évolutives ayant menées aux ordres observés. Dans cette thèse, nous nous intéressons au développement de nouvelles méthodes algorithmiques, par approche d’alignement, afin d’analyser ces différents aspects de l’évolution des génomes. Nous nous intéressons à la comparaison de deux ou d’un ensemble de génomes reliés par une phylogénie, en tenant compte des mutations globales. Pour commencer, nous étudions la complexité théorique de plusieurs variantes du problème de l’alignement de deux ordres de gènes par duplications et pertes, ainsi que de l’approximabilité de ces problèmes. Nous rappelons ensuite les algorithmes exacts, en temps exponentiel, existants, et développons des heuristiques efficaces. Nous proposons, dans un premier temps, DLAlign, une heuristique quadratique pour le problème d’alignement de deux ordres de gènes par duplications et pertes. Ensuite, nous présentons, OrthoAlign, une extension de DLAlign, qui considère, en plus des duplications et pertes, les réarrangements et les substitutions. Nous abordons également le problème de l’alignement phylogénétique de génomes. Pour commencer, l’heuristique OrthoAlign est adaptée afin de permettre l’inférence de génomes ancestraux au noeuds internes d’un arbre phylogénétique. Nous proposons enfin, MultiOrthoAlign, une heuristique plus robuste, basée sur la médiane, pour l’inférence de génomes ancestraux et d’histoires évolutives d’un ensemble de génomes représentés aux feuilles d’un arbre phylogénétique.During the evolution process, genomes accumulate mutations that may affect the genome at different levels, ranging from one base to the overall gene content. Global mutations affecting gene content and organization are mainly duplications, losses and rearrangements. By comparing gene orders, it is possible to infer the most frequent events, the gene content in the ancestral genomes and the evolutionary histories of the observed gene orders. In this thesis, we are interested in developing new algorithmic methods based on an alignment approach for comparing two or a set of genomes represented as gene orders and related through a phylogenetic tree, based on global mutations. We study the theoretical complexity and the approximability of different variants of the two gene orders alignment problem by duplications and losses. Then, we present the existing exact exponential time algorithms, and develop efficient heuristics for these problems. First, we developed DLAlign, a quadratic time heuristic for the two gene orders alignment problem by duplications and losses. Then, we developed OrthoAlign, a generalization of DLAlign, accounting for most genome-wide evolutionary events such as duplications, losses, rearrangements and substitutions. We also study the phylogenetic alignment problem. First, we adapt our heuristic OrthoAlign in order to infer ancestral genomes at the internal nodes of a given phylogenetic tree. Finally, we developed MultiOrthoAlign, a more robust heuristic, based on the median problem, for the inference of ancestral genomes and evolutionary histories of extent genomes labeling leaves of a phylogenetic tree
    corecore