336 research outputs found
Characterizing Scales of Genetic Recombination and Antibiotic Resistance in Pathogenic Bacteria Using Topological Data Analysis
Pathogenic bacteria present a large disease burden on human health. Control
of these pathogens is hampered by rampant lateral gene transfer, whereby
pathogenic strains may acquire genes conferring resistance to common
antibiotics. Here we introduce tools from topological data analysis to
characterize the frequency and scale of lateral gene transfer in bacteria,
focusing on a set of pathogens of significant public health relevance. As a
case study, we examine the spread of antibiotic resistance in Staphylococcus
aureus. Finally, we consider the possible role of the human microbiome as a
reservoir for antibiotic resistance genes.Comment: 12 pages, 6 figures. To appear in AMT 2014 Special Session on
Advanced Methods of Interactive Data Mining for Personalized Medicin
Recommended from our members
Topology of Reticulate Evolution
The standard representation of evolutionary relationships is a bifurcating tree. However, many types of genetic exchange, collectively referred to as reticulate evolution, involve processes that cannot be modeled as trees. Increasing genomic data has pointed to the prevalence of reticulate processes, particularly in microorganisms, and underscored the need for new approaches to capture and represent the scale and frequency of these events.
This thesis contains results from applying new techniques from applied and computational topology, under the heading topological data analysis, to the problem of characterizing reticulate evolution in molecular sequence data. First, we develop approaches for analyzing sequence data using topology. We propose new topological constructions specific to molecular sequence data that generalize standard constructions such as Vietoris-Rips. We draw on previous work in phylogenetic networks and use homology to provide a quantitative measure of reticulate events. We develop methods for performing statistical inference using topological summary statistics.
Next, we apply our approach to several types of molecular sequence data. First, we examine the mosaic genome structure in phages. We recover inconsistencies in existing morphology-based taxonomies, use a network approach to construct a genome-based representation of phage relationships, and identify conserved gene families within phage populations. Second, we study influenza, a common human pathogen. We capture widespread patterns of reassortment, including nonrandom cosegregation of segments and barriers to subtype mixing. In contrast to traditional influenza studies, which focus on the phylogenetic branching patterns of only the two surface-marker proteins, we use whole-genome data to represent influenza molecular relationships. Using this representation, we identify unexpected relationships between divergent influenza subtypes. Finally, we examine a set of pathogenic bacteria. We use two sources of data to measure rates of reticulation in both the core genome and the mobile genome across a range of species. Network approaches are used to represent the population of S. aureus and analyze the spread of antibiotic resistance genes. The presence of antibiotic resistance genes in the human microbiome is investigated
Inference of Ancestral Recombination Graphs through Topological Data Analysis
The recent explosion of genomic data has underscored the need for
interpretable and comprehensive analyses that can capture complex phylogenetic
relationships within and across species. Recombination, reassortment and
horizontal gene transfer constitute examples of pervasive biological phenomena
that cannot be captured by tree-like representations. Starting from hundreds of
genomes, we are interested in the reconstruction of potential evolutionary
histories leading to the observed data. Ancestral recombination graphs
represent potential histories that explicitly accommodate recombination and
mutation events across orthologous genomes. However, they are computationally
costly to reconstruct, usually being infeasible for more than few tens of
genomes. Recently, Topological Data Analysis (TDA) methods have been proposed
as robust and scalable methods that can capture the genetic scale and frequency
of recombination. We build upon previous TDA developments for detecting and
quantifying recombination, and present a novel framework that can be applied to
hundreds of genomes and can be interpreted in terms of minimal histories of
mutation and recombination events, quantifying the scales and identifying the
genomic locations of recombinations. We implement this framework in a software
package, called TARGet, and apply it to several examples, including small
migration between different populations, human recombination, and horizontal
evolution in finches inhabiting the Gal\'apagos Islands.Comment: 33 pages, 12 figures. The accompanying software, instructions and
example files used in the manuscript can be obtained from
https://github.com/RabadanLab/TARGe
Genetic and genomic variability of Legionella pneumophila: applications to molecular epidemiology and public health
Tesis por compendio[EN] Legionella pneumophila is a strictly environmental and opportunistic pathogen that can cause severe pneumonia after inhalation of aerosols with enough bacterial load. Outbreaks and sporadic cases are usually localized in temperate environments, and the reservoirs are often water-related sources where biofilms are created. The existence of non-cultivable forms of the bacteria increases the risk for public health, as culture-based methods may miss them, thus complicating the environmental investigations of the sources.
Genetic classification through the Sequence-Based Typing (SBT) technique allowed an increased discrimination among L. pneumophila strains compared to previous methods. SBT data can also be used for genetic variability and population structure studies, but a more exhaustive analysis can be performed using high-throughput genome sequencing strategies.
This thesis describes the use of both SBT and genomic sequencing to evaluate and provide solutions to different public health needs in L. pneumophila epidemiology. We have focused in the Comunidad Valenciana (CV), the second region in Spain with the highest incidence of Legionellosis, with special interest in the city of Alcoy, where recurrent outbreaks have occurred since 1998.
Firstly, SBT data were used to gain a deeper insight into the genetic variability and distribution of the most abundant Sequence Types (ST) in the CV area. We have shown that the level of variability in this region is comparable to that from other countries, revealing the existence of both locally and broadly extended profiles. Approximately half of the observed genetic diversity was found to result from geographical and temporal structure.
Secondly, L. pneumophila detection from environmental sources remains a challenge for public health. A comparison between water and biofilm samples using a sensitive touchdown PCR (TD-PCR) strategy revealed that the use of biofilms increased by ten-fold the detection rate. This method allowed evaluating the hidden uncultivable L. pneumophila diversity in the locality of Alcoy and the real-time investigation of a Legionellosis outbreak affecting a hotel in Calpe (Southeast of Spain) in 2012.
Thirdly, genomic sequencing was applied to a set of 69 strains isolated during 13 outbreaks occurred in Alcoy in the period 1999-2010, mainly the recurrent ST578. Higher intra-outbreak variability than expected was observed, pointing to the potential existence of multiple sources in this endemic area or high environmental diversity. Interestingly, above 98% of the genomic variability in this ST was found as being incorporated through recombination processes rather than through point mutations.
Finally, a metagenomic analysis of environmental biofilms from Alcoy revealed a microbial community dominated by Proteobacteria, Cyanobacteria, Actinobacteria and Bacteroidetes. Despite the known endemism of Legionella in this area, the genus was only found in a relative abundance ranging 0.01-0.07%, which explains the low recovery from environmental sources.
In summary, the results from this thesis can benefit public health efforts to control this pathogen in the environment, as we provide new insight into its molecular epidemiology, with immediate applications to surveillance and outbreak investigations.[ES] Legionella pneumophila es un patógeno oportunista estrictamente ambiental capaz de causar neumonía debido a la inhalación de aerosoles con suficiente carga bacteriana. Los brotes y casos esporádicos suelen producirse en ambientes templados y los reservorios encontrarse en zonas con agua donde pueden crearse biopelículas microbianas. La existencia de formas no cultivables de la bacteria aumenta el riesgo para la salud pública, ya que los métodos estándar basados en cultivo microbiológico no pueden detectarlas, complicando las investigaciones ambientales.
La clasificación genética basada en el método Sequence-Based Typing (SBT) permite un mayor poder de discriminación entre cepas de L. pneumophila en comparación con métodos previos. Los datos derivados del SBT pueden utilizarse para estudios de variabilidad genética y estructura poblacional. Sin embargo, puede llevarse a cabo un análisis más exhaustivo mediante técnicas de secuenciación genómica de alto rendimiento.
Esta tesis describe la utilización tanto de SBT como de secuenciación genómica para evaluar e incluso proponer soluciones a diferentes necesidades en salud pública relacionadas con la epidemiología de L. pneumophila. Nos centramos en la Comunidad Valenciana (CV), la segunda región en España con mayor incidencia de Legionelosis, con especial interés en la localidad de Alcoy, donde ocurren brotes de forma recurrente.
En primer lugar, utilizamos datos derivados de SBT para conocer mejor la variabilidad y la distribución de los perfiles genéticos (Sequence Types, ST) en el área de la CV. Mostramos que el nivel de variabilidad en sólo esta región es comparable a la de otros países, con perfiles extendidos local y globalmente. Aproximadamente la mitad de la diversidad genética observada se estima que procede de estructuración geográfica y temporal.
En segundo lugar, la detección de L. pneumophila a partir de fuentes ambientales sigue suponiendo un reto para la salud pública. En esta tesis realizamos una comparación entre la detección mediante touchdown PCR (TD-PCR) a partir de muestras de agua y biopelículas microbianas y mostramos que estas últimas proporcionan un aumento de 10 veces en la tasa de detección de la bacteria. Este método permitió evaluar la diversidad no cultivable de L. pneumophila en la localidad de Alcoy y la investigación a tiempo real de un brote en un hotel en Calpe (Sudeste de España) en 2012.
A continuación, aplicamos la secuenciación genómica a 69 cepas aisladas durante 13 brotes ocurridos en Alcoy en el período 1999-2010, principalmente el recurrente ST578. Se observó mayor variabilidad entre cepas de un mismo brote que la esperada, lo cual apunta a la existencia potencial de múltiples fuentes en este área, o alta diversidad ambiental. Además, se observó que más del 98% de la variabilidad genómica fue introducida por procesos de recombinación y no de mutación puntual.
Finalmente, se realizó un análisis metagenómico de biopelículas ambientales recogidas en Alcoy. Se encontró que la comunidad está dominada por Proteobacteria, Cyanobacteria, Actinobacteria y Bacteroidetes. A pesar del conocido endemismo de Legionella en el área, este género sólo se encontró en una abundancia relativa entre 0.01-0.07%, lo cual explica su baja tasa de recuperación a partir de muestras ambientales.
En resumen, los resultados de esta tesis pueden ser de utilidad para los programas de control de este patógeno llevados a cabo por las autoridades de salud pública, ya que proporcionan una nueva percepción de su epidemiología molecular, con aplicación inmediata a la vigilancia e investigación de brotes.[CA] Legionella pneumophila és un patogen oportunista estrictament ambiental capaç d'ocasionar pneumònia degut a la inhalació d'aerosols amb la suficient carga bacteriana. Els brots i casos esporàdics solen ocórrer en ambients temperats, i els reservoris solen trobar-se en zones amb aigua on poden crear-se biopel·lícules microbianes. La existència de formes no cultivables del bacteri augmenten el risc per a la salut pública, ja que els mètodes estàndard basats en el cultiu microbiològic no poden detectar-les, complicant les investigacions ambientals.
La classificació genètica basada en el mètode Sequence-Based Typing (SBT) permet un major poder de discriminació entre soques de L. pneumophila en comparació amb previs mètodes. Les dades derivades del SBT poden utilitzar-se per a estudis de variabilitat genètica i estructura poblacional, però un anàlisis més exhaustiu pot dur-se a terme a través de tècniques de seqüenciació genòmica d'alt rendiment.
Esta tesis descriu la utilització tant del SBT com de la seqüenciació genòmica per a avaluar i proposar solucions a diferents necessitats en salut pública relacionades amb l'epidemiologia de L. pneumophila. Ens centrem en la Comunitat Valenciana (CV), la segona regió d'Espanya amb la major incidència de Legionel·losi, amb especial interès en la localitat d'Alcoi, on els brots ocorren de forma recurrent des de 1998.
Primer, hem utilitzat dades derivades del SBT per a conèixer millor la variabilitat i la distribució dels perfils genètics (Sequence Types, ST) en l'àrea de la CV. Mostrem que el nivell de variabilitat en només aquesta regió és comparable a la d'altres països, amb perfils estesos tant de forma local com més amplia. Aproximadament la meitat de la diversitat genètica observada s'estima que procedeix d'estructuració geogràfica i temporal.
Segon, la detecció de L. pneumophila a partir de fonts ambientals continua suposant un repte per a la salut pública. En aquesta tesis realitzem una comparació entre la detecció mitjançant touchdown PCR (TD-PCR) a partir de mostres d'aigua i biopel·lícules microbianes i mostrem que aquestes últimes proporcionen un augment de deu vegades en la tassa de detecció. A més, aquest mètode ens va permetre avaluar la diversitat no cultivable de L. pneumophila a la localitat d'Alcoi i la investigació a temps real d'un brot de Legionelosis que va afectar a un hotel en Calp (Sud-est d'Espanya) a l'any 2012.
Tercer, vam aplicar la seqüenciació genòmica a 69 soques aïllades durant 13 brots ocorreguts a Alcoi en el període 1999-2010, principalment el recurrent ST578. Es va observar una major variabilitat entre soques d'un mateix brot de l'esperada, apuntant a l'existència potencial de múltiples fonts en aquesta àrea, considerada endèmica, o alta diversitat ambiental. A més, es va observar que més del 98% de la variabilitat genòmica havia sigut introduïda a partir de processos de recombinació i no de mutació puntual.
Finalment, es va realitzar una anàlisi metagenòmica de biopel·lícules ambientals recollides a Alcoi. Varem trobar que la comunitat està dominada per Proteobacteria, Cyanobacteria, Actinobacteria i Bacteroidetes. A pesar del conegut endemisme de Legionella en l'àrea, aquest gènere només es va trobar en una abundància relativa entre 0.01-0.07%, el qual explica la seua baixa tassa de recuperació a partir de mostres ambientals.
En resum, els resultats d'aquesta tesi poden ser d'utilitat per als programes de control d'aquest patogen duts a terme per les autoritats de salut pública, ja que proporcionen una nova percepció de la seua epidemiologia molecular, amb aplicació immediata a la vigilància i la investigació de brots.Sánchez Busó, L. (2015). Genetic and genomic variability of Legionella pneumophila: applications to molecular epidemiology and public health [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/52854TESISPremios Extraordinarios de tesis doctoralesCompendi
Investigation into the changing colonisation of skin bacteria during isotretinoin treatment for acne vulgaris
Poster presentatio
- …