12 research outputs found

    Développement d'une base de données sur la résistance aux antibiotiques et son utilisation en génomique

    Get PDF
    Le projet de maîtrise consistait à développer une base de données (BD) sur la résistance bactérienne aux antibiotiques et de l’utiliser dans les analyses bio-informatiques de deux projets de génomiques. La BD MERGEM (« Mobile Elements and Resistance Genes Enhanced for Metagenomics ») mettait l’emphase sur la bonne nomenclature des gènes et la fiabilité de l’annotation de leurs séquences, qui s’avère un réel problème dans les BD publiques en biologie. La BD MERGEM mit aussi de l’avant l’utilisation de technologies du Web sémantique et de développementWeb pour enrichir et publier son contenu. De plus, un pipeline bio-informatique d’annotations fonctionnelles fut réalisé dans le but de correctement identifier les éléments de MERGEM et leur contexte génomique dans deux projets de séquençages importants : 264 métagénomes du microbiote intestinale et 390 génomes de Pseudomonas aeruginosa. Les résultats démontrent l’utilité de développer des BD spécialisées en génomique.The current Master’s project consist of the development of a database (DB) on bacterial antibiotic resistance and its use in bioinformatic analyses for two major genomic projects. The DB is called MERGEM (Mobile Elements and Resistance Genes Enhanced for Metagenomics) and puts a particular emphasis on a good genes nomenclature and the reliability of the annotation of their sequences, which is a real problem in biological public databases. The MERGEM database also adopts technologies of the SemanticWeb and utilizesWeb development to enrich and publish its content. Furthermore, a bioinformatic annotation pipeline was developed in order to correctly identify MERGEMs’ genes and their contexts in two important sequencing projects : one with 264 metagenomes from the human gut microbiome and another one consisting of 390 Pseudomonas aeruginosa genomes. The results of this project proves the usefulness of specialized databases in genomic studies

    Génomique et métagénomique comparatives des bactéries

    Get PDF
    Les domaines de la génomique et de la métagénomique ont apporté un support incommensurable à l'avancement de nos connaissances sur la génétique des bactéries. Les bactéries pathogènes sont maintenant séquencées et analysées pour identifier les facteurs causant leur virulence et/ou leur résistance aux antibiotiques ainsi que leur capacité à transmettre ces éléments génétiques qui sont d'un intérêt clinique. Les bactéries commensales, quant à elles, sont de plus en plus associées à la santé humaine et sont étudiées à l'aide de la métagénomique pour contrer les difficultés liées à leur culture étant donné leur grande diversité en matière de besoins métaboliques. Les nouvelles technologies de séquençages permettent donc de produire en masse ces séquences d'ADN à des fins de caractérisation et de comparaison dans le but d'élucider des questions souvent reliées à la santé humaine. Les avancées en génomique et en métagénomique requièrent des logiciels bio-informatiques capables de gérer et de s'adapter à la quantité massive et croissante des données biologiques. Les deux premières hypothèses de ce doctorat concernaient le développement de méthodes efficaces et flexibles pour l'analyse de génomes et de métagénomes bactériens. Plusieurs méthodes d'analyses bio-informatiques ont été explorées et ont mené à l'implémentation de deux logiciels pour supporter les hypothèses de recherche : Ray Surveyor et kAAmer. La première hypothèse de recherche consistait à vérifier s'il était possible d'obtenir une comparaison de génomes, depuis leur simple contenu en k-mers de séquences d'ADN, avec des résultats analogues aux comparaisons génomiques standards comme le pourcentage moyen d'identités ou les arbres phylogénétiques, mais sans nécessiter d'alignements de séquences. Nous avons démontré avec le logiciel Ray Surveyor et plusieurs analyses de génomique et de métagénomique bactérienne, qu'il était possible d'obtenir de tels comparaisons à l'aide de séquences d'ADN découpées en k-mer. Dans l'étude qui présenta les résultats de l'hypothèse de recherche, nous avons aussi estimé la propension génotypique de plusieurs espèces bactériennes à des phénotypes d'intérêt clinique à l'aide de bases de données de gènes spécialisées. La deuxième hypothèse était de tester s'il était possible de développer un logiciel pour l'identification de séquences protéiques, basé sur des k-mers d'acides aminés, qui serait plus performant que les logiciels existants, spécifiquement pour l'identification de protéines avec un haut degré d'homologie. Les travaux menèrent à l'implémentation de kAAmer, un logiciel permettant de créer des bases de données de protéines où la recherche de séquence se fait par association exacte de k-mers tout en supportant l'alignement de séquences. KAAmer s'est avéré très efficace pour la recherche de séquences de protéines avec des performances surpassant même, dans la majorité des scénarios, les aligneurs de séquences les plus rapides. D'autres fonctionnalités intéressantes sont aussi offertes par kAAmer, tel que la possibilité d'héberger une base de données en tant que service de manière permanente. Enfin, la troisième et dernière hypothèse de recherche visait à valider si les deux logiciels développés durant le projet de doctorat (Ray Surveyor et kAAmer) produiraient des résultats viables dans une analyse métagénomique du microbiote intestinal en lien avec l'obésité. Les profilages taxonomique et fonctionnel furent donc réalisés avec kAAmer et la comparaison de novo des métagénomes investiguée avec Ray Surveyor. Les résultats obtenus se sont avérés significatifs et ont démontrés, entre autres, une tendance vers une abondance relative plus élevée pour le phylum Bacteroidetes et moins élevée pour les phyla Firmicutes et Acinetobacteria chez les sujets obèses. Une multitude de fonctions métaboliques se sont aussi avérées significativement différentes dans les conditions normales et d'obésités des métagénomes, avec une mention particulière à celles reliées au métabolisme des acides gras à chaîne courte qui sont reconnues pour être associées à l'obésité.The fields of genomics and metagenomics have provided immeasurable support to the advancement of our knowledge of bacterial genetics. Pathogenic bacteria are now routinely sequenced and analyzed to identify the factors causing their virulence or antibiotic resistance as well as their ability to transmit genetic elements. Commensal bacteria are increasingly associated with human health and are being studied using metagenomics to counter the issues associated with their culture due to their wide range of metabolic needs. Next generation sequencing enabled us to mass-produce these DNA sequences for characterization and comparison purposes in order to elucidate questions related to human health. Improvement in genomics and metagenomics studies required bio-informatics software that are able to manage and adapt to an increasing availability of biological sequences data. The first two hypotheses of this thesis include the development of efficient and flexible methods for the analysis of bacterial genomes and metagenomes. Several bio-informatics analysis methods were explored and led to the implementation of two software to support the research hypotheses: Ray Surveyor and kAAmer. The first research hypothesis was to test the possibility of obtaining a comparison of genomes, from their simple DNA k-mers content, with results analogous to standard genomic comparisons such as average nucleotide identity or phylogenetic trees, but without the need for sequence alignments. Using Ray Surveyor software and several bacterial genomic and metagenomic analyses, we have demonstrated that it is possible to obtain such comparisons using k-mers from DNA sequences. In the study that presented the results of the research hypothesis, we also estimated the genotypic propensity of several bacterial species to clinically relevant phenotypes using specialized gene databases. The second hypothesis was to test the possibility of developing a software for protein sequence identification, based on amino acid k-mers, which would be more efficient than existing software, specifically for the identification of proteins with a high degree of homology. The work led to the implementation of kAAmer, a software solution that allows the creation of protein databases where the sequence search is done by exact match of k-mers, while supporting sequence alignment. KAAmer has proven to be very efficient for protein sequence search with performances surpassing even the fastest sequence aligners in most scenarios. Other interesting features are also offered by kAAmer, such as the possibility to host a database as a service on a permanent basis. Finally, the third and last research hypothesis aimed to test the capacity the two software developed during the PhD project (Ray Surveyor and kAAmer) to produce viable results in a metagenomic analysis of the gut microbiota in relation to obesity. Taxonomic and functional profiling was performed with kAAmer as the de novo comparison of metagenomes with Ray Surveyor. The results obtained were significant and showed, among others, a trend towards higher relative abundance of the Bacteroidetes phylum and lower relative abundance of the Firmicutes and Acinetobacteria phyla in obese subjects. Several metabolic functions were also found to be significantly different in the normal and obese conditions, with a particular mention to the metabolism of short-chain fatty acids (SCFA) that are known to be associated with obesity

    Draft Genome Sequence of an International Clonal Lineage 1 Acinetobacter baumannii Strain from Argentina

    Get PDF
    In the last few years Acinetobacter baumannii has emerged worldwide as an important nosocomial pathogen in medical institutions. Here, we present the draft genome sequence of the international clonal lineage 1 (ICL1) A. baumannii strain A144 that was isolated in a hospital in Buenos Aires City in the year 1997. The strain is susceptible to carbapenems and resistant to trimethoprim and gentamicin.Fil: Vilacoba, Elisabet. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; ArgentinaFil: Déraspe, Maxime. Laval University; CanadáFil: Traglia, German Matias. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; ArgentinaFil: Roy, Paul H.. Laval University; CanadáFil: Ramirez, Maria Soledad. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; Argentina. California State University; Estados UnidosFil: Centron, Daniela. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; Argentin

    Serratia marcescens sch909 as reservoir and source of genetic elements related to wide dissemination of antimicrobial resistance mechanisms

    Get PDF
    Serratia marcescens SCH909 is a multidrug resistant strain isolated in 1988 harboring three class 1 integrons. We wondered if these integrons were retained over time and if there were other antimicrobial resistant determinants contributing to its multidrug resistant profile. Genomic analysis showed a fourth multidrug resistance integron, a Tn7 transposon with dfrA1-sat2-ybeA-ybfA-ybfB-ybgA gene cassettes in the variable region. Insertion sequences were involved in the genesis of novel composite transposons in the L4 subtype plasmid pSCH909, such as Tn6824 carrying an arsenic regulon and two head to head class 1 integrons surrounded by two complete IS1. Remarkably, a novel chromosomal genomic island, SmaR, was identified, closely related to Multiple Antimicrobial Resistance Regions (MARR), usually found in AbaR0-type and AbGRI2-0 from global clones of Acinetobacter baumannii, and in M-type plasmids circulating in Enterobacteriaceae. Maintenance studies showed that the three class 1 integrons were maintained over 1 month without antimicrobial pressure. Since S. marcescens is considered a relevant nosocomial pathogen that can have a wide range of niches - human, plant, animal, soil and inanimate surfaces, our findings support the ability of this species to capture, maintain and spread a broad variety of antimicrobial resistance elements.Fil: Gambino, Anahí Samanta. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; ArgentinaFil: Déraspe, Maxime. Laval University; CanadáFil: Alvarez, Verónica Elizabeth. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; ArgentinaFil: Quiroga, María Paula. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; ArgentinaFil: Corbeil, Jacques. Laval University; CanadáFil: Roy, Paul H.. Laval University; CanadáFil: Centron, Daniela. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Investigaciones en Microbiología y Parasitología Médica. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Investigaciones en Microbiología y Parasitología Médica; Argentin

    Genome and Plasmid Analysis of blaIMP-4-Carrying Citrobacter freundii B38.

    Get PDF
    Sequencing of the blaIMP-4-carrying C. freundii B38 using the PacBio SMRT technique revealed that the genome contained a chromosome of 5,134,500 bp and three plasmids, pOZ172 (127,005 bp), pOZ181 (277,592 bp), and pOZ182 (18,467 bp). Plasmid pOZ172 was identified as IncFIIY, like pP10164-NDM and pNDM-EcGN174. It carries a class 1 integron with four cassettes (blaIMP-4-qacG2-aacA4-aphA15) and a complete hybrid tni module (tniR-tniQ-tniB-tniA). The recombination of tniR from Tn402 (identical) with tniQBA from Tn5053 (99%) occurred within the res site of Tn402/5053 The Tn402/5053-like integron, named Tn6017, was inserted into Tn1722 at the res II site. The replication, partitioning, and transfer systems of pOZ181 were similar to those of IncHI2 plasmids (e.g., R478) and contained a sul1-type class 1 integron with the cassette array orf-dfrA1-orf-gcu37-aadA5 linked to an upstream Tn1696 tnpA-tnpR and to a downstream 3' conserved sequence (3'-CS) and ISCR1 A Tn2 transposon encoding a blaTEM-1 β-lactamase was identified on pOZ182. Other interesting resistance determinants encoded on the B38 chromosome included multidrug resistance (MDR) efflux pumps, an AmpC β-lactamase, and resistances to Cu, Ag, As, and Zn. This is the first report of a complete tni module linked to a blaIMP-4-carrying class 1 integron, which, together with other recently reported non-sul1 integrons, represents the emergence of a distinct evolutionary lineage of class 1 integrons lacking a 3'-CS (qacEΔ1-sul1). The unique cassette array, complete tni module of Tn6017, and incompatibility group of pOZ172 suggest a blaIMP-4 evolutionary pathway in C. freundii B38 different from that for other blaIMP-4 genes found in Gram-negative bacteria in the Western Pacific region

    Making Linked Data SPARQL with the InterMine Biological Data Warehouse

    No full text
    Abstract. InterMine is a system for integrating, analysing, and republishing biological data from multiple sources. It provides access to these data via a web user interface and programmatic web services. However, the precise invocation of services and subsequent exploration of returned data require substantial expertise on the structure of the underlying database. Here, we describe an approach that uses Semantic Web technologies to make InterMine data more broadly accessible and reusable, in accordance with the FAIR principles. We describe a pipeline to extract, transform, and load a Linked Data representation of the InterMine store. We use Docker to bring together SPARQL-aware applications to search, browse, explore, and query the InterMine-based data. Our work therefore extends interoperability of the InterMine platform, and supports new query functionality across InterMine installations and the network of open Linked Data
    corecore