12 research outputs found
Exhaustive Generation of Benzenoid Structures Sharing Common Patterns
Benzenoids are a subfamily of hydrocarbons (molecules that are only made of hydrogen and carbon atoms) whose carbon atoms form hexagons. These molecules are widely studied both experimentally and theoretically and can have various physicochemical properties (mechanical resistance, electronic conductivity, ...) from which a lot of concrete applications are derived. These properties can rely on the existence or absence of fragments of the molecule corresponding to a given pattern (some patterns impose the nature of certain bonds, which has an impact on the whole electronic structure). The exhaustive generation of families of benzenoids sharing the absence or presence of given patterns is an important problem in chemistry, particularly in theoretical chemistry, where various methods can be used to better understand the link between their shapes and their electronic properties.
In this paper, we show how constraint programming can help chemists to answer different questions around this problem. To do so, we propose different models including one based on a variant of the subgraph isomorphism problem and we generate the desired structures using Choco solver
Constraints programming and theoretical chemistry : using CSP formalism to resolve problematics related to benzenoids
La programmation par contraintes (PPC) est une branche de l’intelligence artificielle apparue dans les années 70. Elle s’attache à résoudre des problèmes fortement combinatoires (a minima NP-complets). La PPC repose sur différents formalismes. Dans le cadre de cette thèse, nous nous focalisons sur celui des problèmes de satisfaction de contraintes (CSP) qui consiste à représenter le problème par un ensemble de variables, chacune possédant un ensemble de valeurs qu’elle peut prendre (appelé domaine). Ces variables vont être liées entre elles par des contraintes. L’objectif ici est de trouver une affectation de toutes la variables qui vont respecter toutes les contraintes.Les hydrocarbures aromatiques polycycliques (HAP) sont des molécules uniquement constituées de carbones et d’hydrogènes dont les atomes de carbones forment des cycles fusionnés de différentes tailles. Ces molécules possèdent des propriétés peu communes (stabilité énergétique, structure moléculaire, ...) et sont étudiées dans de nombreux domaines (astrochimie, science des matériaux, ...). Les benzénoïdes sont une sous-famille des HAP et ne sont constitués que de cycles de 6 carbones (donc d'hexagones). Dans ce travail, nous nous sommes intéréssés à deux problématiques liées aux benzénoïdes : la génération exhaustive de toutes les structures de benzénoïdes satisfaisant un ensemble donné de propriétés d’une part, et la détermination de leur aromaticité d’autre part. L’aromaticité est une notion induite par la délocalisation des électrons des PAH. Cette thèse présente entre autre des moyens de résoudre ces problématiques à l'aide de la PPC.Constraint programming (CP) is a branch of artificial intelligence that appeared in the 1970s. It focuses on solving highly combinatorial problems (at least NP-complete). PPC is based on different formalisms. In the context of this thesis, we focus on that of constraint satisfaction problems (CSP) which consists in representing the problem by a set of variables, each having a set of values ​​that it can take (called domain). These variables will be linked together by constraints. The objective here is to find an assignment of all the variables that will respect all the constraints.Polycyclic aromatic hydrocarbons (PAHs) are molecules made up solely of carbons and hydrogens whose carbon atoms form fused rings of different sizes. These molecules have unusual properties (energy stability, molecular structure, etc.) and are studied in many fields (astrochemistry, materials science, etc.). Benzenoids are a subfamily of PAHs and are only made up of 6-carbon rings (hence hexagons).In this work, we are interested in two issues related to benzenoids: the exhaustive generation of all benzenoid structures satisfying a given set of properties on the one hand, and the determination of their aromaticity on the other hand. Aromaticity is a notion induced by the delocalization of PAH electrons. This thesis presents, among other things, ways to solve these problems using PPC
Another Way to Browse the Search Space For Some Transformations from CSP to SAT
International audienc
Another Way to Browse the Search Space For Some Transformations from CSP to SAT
International audienc
ChIPuana: from raw data to epigenomic dynamics
Posté sur BioRxiv le 3 février 2021Abstract We present ChIPuana, a Snakemake-based pipeline for epigenomic data from the raw fastq files to the differential analysis. It can be applied to any chromatin factor, e.g. histone modification or transcription factor, which can be profiled with ChIP-seq. ChIPuana streamlines critical steps like the quality assessment of the immunoprecipitation using cross-correlation and the replicate comparison for both narrow and broad peaks. For the differential analysis ChIPuana provides linear and nonlinear methods for normalisation between samples as well as conservative and stringent models for estimating the variance and testing the significance of the observed binding/marking differences. ChIPuana can process in parallel multiple chromatin factors with different experimental designs, number of biological replicates and/or conditions. It also facilitates the specific parametrisation of each dataset allowing both narrow or broad peak calling, as well as comparisons between the conditions using multiple statistical settings. Finally, complete reports are produced at the end of the bioinformatic and the statistical part of the analysis, which facilitate the data quality control and the interpretation of the results. We explored the discriminative power of the statistical settings for the differential analysis, using a published dataset of three histone marks (H3K4me3, H3K27ac and H3K4me1) and two transcription factors (Oct4 and Klf4) profiled with ChIP-seq in two biological conditions (shControl and shUbc9). We show that distinct results are obtained depending on the sources of ChIP-seq variability and the dynamics of the chromatin factor under study. We propose that ChIPuana can be used to measure the richness of the epigenomic landscape underlying a biological process by identifying diverse regulatory regimes and the associated genes sets
ePeak: from replicated chromatin profiling data to epigenomic dynamics
International audienceWe present ePeak, a Snakemake-based pipeline for the identification and quantification of reproducible peaks from raw ChIP-seq, CUT&RUN and CUT&Tag epigenomic profiling techniques. It also includes a statistical module to perform tailored differential marking and binding analysis with state of the art methods. ePeak streamlines critical steps like the quality assessment of the immunoprecipitation, spike-in calibration and the selection of reproducible peaks between replicates for both narrow and broad peaks. It generates complete reports for data quality control assessment and optimal interpretation of the results. We advocate for a differential analysis that accounts for the biological dynamics of each chromatin factor. Thus, ePeak provides linear and nonlinear methods for normalisation as well as conservative and stringent models for variance estimation and significance testing of the observed marking/binding differences. Using a published ChIP-seq dataset, we show that distinct populations of differentially marked/bound peaks can be identified. We study their dynamics in terms of read coverage and summit position, as well as the expression of the neighbouring genes. We propose that ePeak can be used to measure the richness of the epigenomic landscape underlying a biological process by identifying diverse regulatory regimes
Utiliser la PPC pour générer des structures de benzénoïdes en chimie théorique
National audienceLes benzénoïdes sont une sous-famille d'hydrocarbures (molécules composées uniquement d'atomes d'hydrogène et de carbone) dont les atomes de carbone forment des hexagones. Ces molécules ont fait l'objet de nombreuses études en chimie théorique et possèdent de nombreuses applications concrètes. La génération de benzénoïdes ayant certaines propriétés structurelles (par exemple, ayant un nombre donné d'hexagones ou ayant une structure particulière du point de vue graphique) est un problème intéressant et important. Il constitue une étape préliminaire à l'étude de leurs propriétés chimiques. Dans cet article, nous montrons que modéliser ce problème dans Choco Solver et laisser son moteur de recherche générer les solutions constitue une approche rapide et très flexible. Elle permet notamment de générer des structures répondant aux besoins des chimistes simplement en ajoutant de nouvelles variables et/ou contraintes tout en évitant d'avoir à développer des méthodes algorithmiques ad-hoc. Ce papier est un résumé de [2]
BenzAI: A Program to Design Benzenoids With Defined Properties Using Constraint Programming
International audienceThe BenzAI program can automatically generate benzenoids with defined structural constraints, like the number of hexagons, the number of carbon and/or hydrogen atoms, the existence of symmetries, the number of Kekulé structures, their diameter, or more elaborate criteria like their irregularity. BenzAI allows both automatic generation and manual building of benzenoids including or excluding defined patterns. For all benzenoids with less than 10 rings, it can extract IR spectra from a database that we generated. It computes local aromaticity for closed-shell and mono radical species using circuit-based algorithms. We present practical examples of what can be done with BenzAI for a diversity of cases
Prise en compte de motifs et génération de structures de benzénoïdes
National audienceLes benzénoïdes sont une sous-famille d'hydrocarbures (molécules composées uniquement d'atomes d'hydrogène et de carbone) dont les atomes de carbone forment des hexagones. Ces molécules ont fait l'objet de nombreuses études en chimie théorique et peuvent posséder différentes propriétés physico-chimiques (résistance mécanique, conductivité électronique,. . .) desquelles découlent de nombreuses applications concrètes. Ces propriétés peuvent notamment reposer sur l'existence ou l'absence de fragments de la molécule correspondant à un motif donné (certains motifs imposent la nature de certaines liaisons, ce qui a un impact sur la structure électronique totale). Générer des structures de benzénoïdes tout en maîtrisant la présence ou non d'un certain motif constitue donc une problématique importante en chimie théorique. Dans cet article, nous montrons comment la programmation par contraintes peut aider les chimistes à répondre à différentes questions autour de cette problématique. Pour ce faire, nous proposons différentes modélisations dont une basée sur une variante du problème d'isomorphisme de sous-graphes et nous générons les structures souhaitées à l'aide du solveur Choco