24 research outputs found
From models to data: understanding biodiversity patterns from environmental DNA data
La distribution de l'abondance des espèces en un site, et la similarité de la composition taxonomique d'un site à l'autre, sont deux mesures de la biodiversité ayant servi de longue date de base empirique aux écologues pour tenter d'établir les règles générales gouvernant l'assemblage des communautés d'organismes. Pour ce type de mesures intégratives, le séquençage haut-débit d'ADN prélevé dans l'environnement (" ADN environnemental ") représente une alternative récente et prometteuse aux observations naturalistes traditionnelles. Cette approche présente l'avantage d'être rapide et standardisée, et donne accès à un large éventail de taxons microbiens jusqu'alors indétectables. Toutefois, ces jeux de données de grande taille à la structure complexe sont difficiles à analyser, et le caractère indirect des observations complique leur interprétation. Le premier objectif de cette thèse est d'identifier les modèles statistiques permettant d'exploiter ce nouveau type de données afin de mieux comprendre l'assemblage des communautés. Le deuxième objectif est de tester les approches retenues sur des données de biodiversité du sol en forêt amazonienne, collectées en Guyane française. Deux grands types de processus sont invoqués pour expliquer l'assemblage des communautés d'organismes : les processus "neutres", indépendants de l'espèce considérée, que sont la naissance, la mort et la dispersion des organismes, et les processus liés à la niche écologique occupée par les organismes, c'est-à-dire les interactions avec l'environnement et entre organismes. Démêler l'importance relative de ces deux types de processus dans l'assemblage des communautés est une question fondamentale en écologie ayant de nombreuses implications, notamment pour l'estimation de la biodiversité et la conservation. Le premier chapitre aborde cette question à travers la comparaison d'échantillons d'ADN environnemental prélevés dans le sol de diverses parcelles forestières en Guyane française, via les outils classiques d'analyse statistique en écologie des communautés. Le deuxième chapitre se concentre sur les processus neutres d'assemblages des communautés. S.P. Hubbell a proposé en 2001 un modèle décrivant ces processus de façon probabiliste, et pouvant être utilisé pour quantifier la capacité de dispersion des organismes ainsi que leur diversité à l'échelle régionale simplement à partir de la distribution d'abondance des espèces observée en un site. Dans ce chapitre, les biais liés à l'utilisation de l'ADN environnemental pour reconstituer la distribution d'abondance des espèces sont discutés, et sont quantifiés au regard de l'estimation des paramètres de dispersion et de diversité régionale. Le troisième chapitre se concentre sur la manière dont les différences non-aléatoires de composition taxonomique entre sites échantillonnés, résultant des divers processus d'assemblage des communautés, peuvent être détectées, représentées et interprétés. Un modèle statistique conçu à l'origine pour classifier les documents à partir des thèmes qu'ils abordent est ici appliqué à des échantillons de sol prélevés selon une grille régulière au sein d'une grande parcelle forestière. La structure spatiale de la composition taxonomique des microorganismes est caractérisée avec succès et reliée aux variations fines des conditions environnementales au sein de la parcelle. Les implications des résultats de la thèse sont enfin discutées. L'accent est mis en particulier sur le potentiel des modèles thématique (" topic models ") pour la modélisation des données de biodiversité issues de l'ADN environnemental.Integrative patterns of biodiversity, such as the distribution of taxa abundances and the spatial turnover of taxonomic composition, have been under scrutiny from ecologists for a long time, as they offer insight into the general rules governing the assembly of organisms into ecological communities. Thank to recent progress in high-throughput DNA sequencing, these patterns can now be measured in a fast and standardized fashion through the sequencing of DNA sampled from the environment (e.g. soil or water), instead of relying on tedious fieldwork and rare naturalist expertise. They can also be measured for the whole tree of life, including the vast and previously unexplored diversity of microorganisms. Taking full advantage of this new type of data is challenging however: DNA-based surveys are indirect, and suffer as such from many potential biases; they also produce large and complex datasets compared to classical censuses. The first goal of this thesis is to investigate how statistical tools and models classically used in ecology or coming from other fields can be adapted to DNA-based data so as to better understand the assembly of ecological communities. The second goal is to apply these approaches to soil DNA data from the Amazonian forest, the Earth's most diverse land ecosystem. Two broad types of mechanisms are classically invoked to explain the assembly of ecological communities: 'neutral' processes, i.e. the random birth, death and dispersal of organisms, and 'niche' processes, i.e. the interaction of the organisms with their environment and with each other according to their phenotype. Disentangling the relative importance of these two types of mechanisms in shaping taxonomic composition is a key ecological question, with many implications from estimating global diversity to conservation issues. In the first chapter, this question is addressed across the tree of life by applying the classical analytic tools of community ecology to soil DNA samples collected from various forest plots in French Guiana. The second chapter focuses on the neutral aspect of community assembly. A mathematical model incorporating the key elements of neutral community assembly has been proposed by S.P. Hubbell in 2001, making it possible to infer quantitative measures of dispersal and of regional diversity from the local distribution of taxa abundances. In this chapter, the biases introduced when reconstructing the taxa abundance distribution from environmental DNA data are discussed, and their impact on the estimation of the dispersal and regional diversity parameters is quantified. The third chapter focuses on how non-random differences in taxonomic composition across a group of samples, resulting from various community assembly processes, can be efficiently detected, represented and interpreted. A method originally designed to model the different topics emerging from a set of text documents is applied here to soil DNA data sampled along a grid over a large forest plot in French Guiana. Spatial patterns of soil microorganism diversity are successfully captured, and related to fine variations in environmental conditions across the plot. Finally, the implications of the thesis findings are discussed. In particular, the potential of topic modelling for the modelling of DNA-based biodiversity data is stressed
Modelling spatial patterns in host-associated microbial communities
Microbial communities exhibit spatial structure at different scales, due to constant interactions with their environment and dispersal limitation. While this spatial structure is often considered in studies focusing on free-living environmental communities, it has received less attention in the context of host-associated microbial communities or microbiota. The wider adoption of methods accounting for spatial variation in these communities will help to address open questions in basic microbial ecology as well as realize the full potential of microbiome-aided medicine. Here, we first overview known factors affecting the composition of microbiota across diverse host types and at different scales, with a focus on the human gut as one of the most actively studied microbiota. We outline a number of topical open questions in the field related to spatial variation and patterns. We then review the existing methodology for the spatial modelling of microbiota. We suggest that methodology from related fields, such as systems biology and macro-organismal ecology, could be adapted to obtain more accurate models of spatial structure. We further posit that methodological developments in the spatial modelling and analysis of microbiota could in turn broadly benefit theoretical and applied ecology and contribute to the development of novel industrial and clinical applications.Peer reviewe
Quantifying the impact of ecological memory on the dynamics of interacting communities
Ecological memory refers to the influence of past events on the response of an ecosystem to exogenous or endogenous changes. Memory has been widely recognized as a key contributor to the dynamics of ecosystems and other complex systems, yet quantitative community models often ignore memory and its implications. Recent modeling studies have shown how interactions between community members can lead to the emergence of resilience and multistability under environmental perturbations. We demonstrate how memory can be introduced in such models using the framework of fractional calculus. We study how the dynamics of a well-characterized interaction model is affected by gradual increases in ecological memory under varying initial conditions, perturbations, and stochasticity. Our results highlight the implications of memory on several key aspects of community dynamics. In general, memory introduces inertia into the dynamics. This favors species coexistence under perturbation, enhances system resistance to state shifts, mitigates hysteresis, and can affect system resilience both ways depending on the time scale considered. Memory also promotes long transient dynamics, such as long-standing oscillations and delayed regime shifts, and contributes to the emergence and persistence of alternative stable states. Our study highlights the fundamental role of memory in communities, and provides quantitative tools to introduce it in ecological models and analyse its impact under varying conditions.</p
Modelling spatial patterns in host-associated microbial communities
Microbial communities exhibit spatial structure at different scales, due to constant interactions with their environment and dispersal limitation. While this spatial structure is often considered in studies focusing on free-living environmental communities, it has received less attention in the context of host-associated microbial communities or microbiota. The wider adoption of methods accounting for spatial variation in these communities will help to address open questions in basic microbial ecology as well as realize the full potential of microbiome-aided medicine. Here, we first overview known factors affecting the composition of microbiota across diverse host types and at different scales, with a focus on the human gut as one of the most actively studied microbiota. We outline a number of topical open questions in the field related to spatial variation and patterns. We then review the existing methodology for the spatial modelling of microbiota. We suggest that methodology from related fields, such as systems biology and macro-organismal ecology, could be adapted to obtain more accurate models of spatial structure. We further posit that methodological developments in the spatial modelling and analysis of microbiota could in turn broadly benefit theoretical and applied ecology and contribute to the development of novel industrial and clinical applications
Des modèle aux données: comprendre la structure de la biodiversité à partir de l'ADN environnemental
Integrative patterns of biodiversity, such as the distribution of taxa abundances and the spatial turnover of taxonomic composition, have been underscrutiny from ecologists for a long time, as they offer insight into the general rules governing the assembly of organisms into ecological communities. Thank to recent progress in high-throughput DNA sequencing, these patterns can now be measured in a fast and standardized fashion through the sequencing of DNA sampled from the environment (e.g. soil or water), instead of relying on tedious fieldwork and rare naturalist expertise. They can also be measured for the whole tree of life, including the vast and previously unexplored diversity of microorganisms. Taking full advantage of this new type of data is challenging however: DNA-based surveys are indirect, and suffer as such from many potential biases; they also produce large and complex datasets compared to classical censuses. The first goal of this thesis is to investigate how statistical tools and models classically used in ecology or coming from other fields can be adapted to DNA-based data so as to better understand the assembly of ecological communities. The second goal is to apply these approaches to soil DNA data from the Amazonian forest, the Earth’s most diverse land ecosystem.Two broad types of mechanisms are classically invoked to explain the assembly of ecological communities: ‘neutral’ processes, i.e. the random birth, death and dispersal of organisms, and ‘niche’ processes, i.e. the interaction of the organisms with their environment and with each other according to their phenotype. Disentangling the relative importance of these two types of mechanisms in shaping taxonomic composition is a key ecological question, with many implications from estimating global diversity to conservation issues. In the first chapter, this question is addressed across the tree of life by applying the classical analytic tools of community ecology to soil DNA samples collected from various forest plots in French Guiana.The second chapter focuses on the neutral aspect of community assembly. A mathematical model incorporating the key elements of neutral community assembly has been proposed by S.P. Hubbell in 2001, making it possible to infer quantitative measures of dispersal and of regional diversity from the local distribution of taxa abundances. In this chapter, the biases introduced when reconstructing the taxa abundance distribution from environmental DNA data are discussed, and their impact on the estimation of the dispersal and regional diversity parameters is quantified.The third chapter focuses on how non-random differences in taxonomic composition across a group of samples, resulting from various community assembly processes, can be efficiently detected, represented and interpreted. A method originally designed to model the different topics emerging from a set of text documents is applied here to soil DNA data sampled along a grid over a large forest plot in French Guiana. Spatial patterns of soil microorganism diversity are successfully captured, and related to fine variations in environmental conditions across the plot.Finally, the implications of the thesis findings are discussed. In particular, the potential of topic modelling for the modelling of DNA-based biodiversity data is stressed.La distribution de l’abondance des espèces en un site, et la similarité de la composition taxonomique d’un site à l’autre, sont deux mesures de la biodiversité ayant servi de longue date de base empirique aux écologues pour tenter d’établir les règles générales gouvernant l’assemblage des communautés d’organismes. Pour ce type de mesures intégratives, le séquençage haut-débit d'ADN prélevé dans l'environnement (« ADN environnemental ») représente une alternative récente et prometteuse aux observations naturalistes traditionnelles. Cette approche présente l’avantage d’être rapide et standardisée, et donne accès à un large éventail de taxons microbiens jusqu’alors indétectables. Toutefois, ces jeux de données de grande taille à la structure complexe sont difficiles à analyser, et le caractère indirect des observations complique leur interprétation. Le premier objectif de cette thèse est d’identifier les modèles statistiques permettant d’exploiter ce nouveau type de données pour mieux comprendre l’assemblage des communautés. Le deuxième objectif est de tester les approches retenues sur des données de biodiversité du sol en forêt amazonienne, collectées en Guyane française.Deux grands types de processus sont invoqués pour expliquer l'assemblage des communautés d’organismes : les processus "neutres", indépendants de l’espèce considérée, que sont la naissance, la mort et la dispersion des organismes, et les processus liés à la niche écologique occupée par les organismes, c'est-à-dire les interactions avec l’environnement et entre organismes. Démêler l'importance relative de ces deux types de processus dans l’assemblage des communautés est une question fondamentale en écologie ayant de nombreuses implications, notamment pour l'estimation de la biodiversité et la conservation. Le premier chapitre aborde cette question à travers la comparaison d’échantillons d'ADN environnemental prélevés dans le sol de diverses parcelles forestières en Guyane française, via les outils classiques d’analysestatistique en écologie des communautés.Le deuxième chapitre se concentre sur les processus neutres d’assemblages des communautés. S.P. Hubbell a proposé en 2001 un modèle décrivant ces processus de façon probabiliste, et pouvant être utilisé pour quantifier la capacité de dispersion des organismes ainsi que leur diversité à l’échelle régionale simplement à partir de la distribution d’abondance des espèces observée en un site. Dans ce chapitre, les biais liés à l’utilisation de l’ADN environnemental pour reconstituer la distribution d’abondance des espèces sont discutés, et sont quantifiés au regard de l’estimation des paramètres de dispersion et de diversité régionale.Le troisième chapitre se concentre sur la manière dont les différences non-aléatoires de composition taxonomique entre sites échantillonnés, résultant des divers processus d’assemblage des communautés, peuvent être détectées, représentées et interprétés. Un modèle statistique conçu à l'origine pour classifier les documents à partir des thèmes qu’ils abordent est ici appliqué à des échantillons de sol prélevés selon une grille régulière au sein d’une grande parcelle forestière. La structure spatiale de la composition taxonomique des microorganismes est caractérisée avec succès et reliée aux variations fines des conditions environnementales au sein de la parcelle.Les implications des résultats de la thèse sont enfin discutées. L'accent est mis en particulier sur le potentiel des modèles thématique (« topic models ») pour la modélisation des données de biodiversité issues de l’ADN environnemental
Des modèles aux données : comprendre la structure de la biodiversité à partir de l'ADN
Integrative patterns of biodiversity, such as the distribution of taxa abundances and the spatial turnover of taxonomic composition, have been under scrutiny from ecologists for a long time, as they offer insight into the general rules governing the assembly of organisms into ecological communities. Thank to recent progress in high-throughput DNA sequencing, these patterns can now be measured in a fast and standardized fashion through the sequencing of DNA sampled from the environment (e.g. soil or water), instead of relying on tedious fieldwork and rare naturalist expertise. They can also be measured for the whole tree of life, including the vast and previously unexplored diversity of microorganisms. Taking full advantage of this new type of data is challenging however: DNA-based surveys are indirect, and suffer as such from many potential biases; they also produce large and complex datasets compared to classical censuses. The first goal of this thesis is to investigate how statistical tools and models classically used in ecology or coming from other fields can be adapted to DNA-based data so as to better understand the assembly of ecological communities. The second goal is to apply these approaches to soil DNA data from the Amazonian forest, the Earth's most diverse land ecosystem. Two broad types of mechanisms are classically invoked to explain the assembly of ecological communities: 'neutral' processes, i.e. the random birth, death and dispersal of organisms, and 'niche' processes, i.e. the interaction of the organisms with their environment and with each other according to their phenotype. Disentangling the relative importance of these two types of mechanisms in shaping taxonomic composition is a key ecological question, with many implications from estimating global diversity to conservation issues. In the first chapter, this question is addressed across the tree of life by applying the classical analytic tools of community ecology to soil DNA samples collected from various forest plots in French Guiana. The second chapter focuses on the neutral aspect of community assembly.[...]La distribution de l'abondance des espèces en un site, et la similarité de la composition taxonomique d'un site à l'autre, sont deux mesures de la biodiversité ayant servi de longue date de base empirique aux écologues pour tenter d'établir les règles générales gouvernant l'assemblage des communautés d'organismes. Pour ce type de mesures intégratives, le séquençage haut-débit d'ADN prélevé dans l'environnement (" ADN environnemental ") représente une alternative récente et prometteuse aux observations naturalistes traditionnelles. Cette approche présente l'avantage d'être rapide et standardisée, et donne accès à un large éventail de taxons microbiens jusqu'alors indétectables. Toutefois, ces jeux de données de grande taille à la structure complexe sont difficiles à analyser, et le caractère indirect des observations complique leur interprétation. Le premier objectif de cette thèse est d'identifier les modèles statistiques permettant d'exploiter ce nouveau type de données afin de mieux comprendre l'assemblage des communautés. Le deuxième objectif est de tester les approches retenues sur des données de biodiversité du sol en forêt amazonienne, collectées en Guyane française. Deux grands types de processus sont invoqués pour expliquer l'assemblage des communautés d'organismes : les processus "neutres", indépendants de l'espèce considérée, que sont la naissance, la mort et la dispersion des organismes, et les processus liés à la niche écologique occupée par les organismes, c'est-à-dire les interactions avec l'environnement et entre organismes. Démêler l'importance relative de ces deux types de processus dans l'assemblage des communautés est une question fondamentale en écologie ayant de nombreuses implications, notamment pour l'estimation de la biodiversité et la conservation. Le premier chapitre aborde cette question à travers la comparaison d'échantillons d'ADN environnemental prélevés dans le sol de diverses parcelles forestières en Guyane française, via les outils classiques d'analyse statistique en écologie des communautés. Le deuxième chapitre se concentre sur les processus neutres d'assemblages des communautés.[...
Une approche comparative phylogénétique révèle le conservatisme évolutif, la composition ancestrale et l'intégration du microbiote intestinal des vertébrés
International audienceHow host-associated microbial communities evolve as their hosts diversify remains equivocal: How conserved is their composition? What was the composition of ancestral microbiota? Do microbial taxa covary in abundance over millions of years? Multivariate phylogenetic models of trait evolution are key to answering similar questions for complex host phenotypes, yet they are not directly applicable to relative abundances, which usually characterize microbiota. Here, we extend these models in this context, thereby providing a powerful approach for estimating phylosymbiosis (the extent to which closely related host species harbor similar microbiota), ancestral microbiota composition, and integration (evolutionary covariations in bacterial abundances). We apply our model to the gut microbiota of mammals and birds. We find significant phylosymbiosis that is not entirely explained by diet and geographic location, indicating that other evolutionary-conserved traits shape microbiota composition. We identify main shifts in microbiota composition during the evolution of the two groups and infer an ancestral mammalian microbiota consistent with an insectivorous diet. We also find remarkably consistent evolutionary covariations among bacterial orders in mammals and birds. Surprisingly, despite the substantial variability of present-day gut microbiota, some aspects of their composition are conserved over millions of years of host evolutionary history.L'évolution des communautés microbiennes associées aux hôtes au cours de leur diversification reste équivoque : dans quelle mesure leur composition est-elle conservée ? Quelle était la composition du microbiote ancestral ? Les abondances des taxons microbiens covarient-elles sur des millions d'années ? Les modèles phylogénétiques multivariés de l'évolution des caractères sont essentiels pour répondre à des questions similaires concernant les phénotypes complexes des hôtes, mais ils ne sont pas directement applicables aux abondances relatives, qui caractérisent généralement les microbiotes. Ici, nous étendons ces modèles dans ce contexte, fournissant ainsi une approche puissante pour estimer la phylosymbiose (la mesure dans laquelle des espèces phylogénétiquement proches hébergent un microbiote similaire), la composition du microbiote ancestral et son intégration (covariations évolutives dans les abondances bactériennes). Nous appliquons notre modèle au microbiote intestinal des mammifères et des oiseaux. Nous trouvons une phylosymbiose significative qui n'est pas entièrement expliquée par le régime alimentaire et la localisation géographique, ce qui indique que d'autres traits conservés au cours de l'évolution façonnent la composition du microbiote. Nous identifions les principaux changements dans la composition du microbiote au cours de l'évolution des deux groupes et en déduisons un microbiote ancestral de mammifère compatible avec un régime insectivore. Nous trouvons également des covariations évolutives remarquablement cohérentes entre les ordres bactériens chez les mammifères et les oiseaux. De manière surprenante, malgré la variabilité substantielle du microbiote intestinal actuel, certains aspects de sa composition sont conservés sur des millions d'années d'histoire évolutive des hôtes
Quantifying the impact of ecological memory on the dynamics of interacting communities
Ecological memory refers to the influence of past events on the response of an ecosystem to exogenous or endogenous changes. Memory has been widely recognized as a key contributor to the dynamics of ecosystems and other complex systems, yet quantitative community models often ignore memory and its implications. Recent modeling studies have shown how interactions between community members can lead to the emergence of resilience and multistability under environmental perturbations. We demonstrate how memory can be introduced in such models using the framework of fractional calculus. We study how the outcomes of a well-characterized interaction model are affected by gradual increases in ecological memory under varying initial conditions, perturbations, and stochasticity. Our results highlight the implications of memory on several key aspects of community dynamics. In general, memory introduces inertia into the dynamics. This favors species coexistence under perturbation, enhances system resistance to state shifts, mitigates hysteresis, and can affect system resilience both ways depending on the time scale considered. Memory also promotes long transient dynamics, such as long-standing oscillations and delayed regime shifts, and contributes to the emergence and persistence of alternative stable states. Our study highlights the fundamental role of memory on ecological communities, and provides quantitative tools to introduce it in ecological models and analyse its impact under varying conditions.SCOPUS: ar.jinfo:eu-repo/semantics/publishe
Latent Dirichlet Allocation reveals spatial and taxonomic structure in a DNA‐based census of soil biodiversity from a tropical forest
International audienceHigh-throughput sequencing of amplicons from environmental DNA samples permits rapid, standardized and comprehensive biodiversity assessments. However, retriev-ing and interpreting the structure of such data sets requires efficient methods for di-mensionality reduction. Latent Dirichlet Allocation (LDA) can be used to decompose environmental DNA samples into overlapping assemblages of co-occurring taxa. It is a flexible model-based method adapted to uneven sample sizes and to large and sparse data sets. Here, we compare LDA performance on abundance and occurrence data, and we quantify the robustness of the LDA decomposition by measuring its stability with respect to the algorithm's initialization. We then apply LDA to a survey of 1,131 soil DNA samples that were collected in a 12-ha plot of primary tropical for-est and amplified using standard primers for bacteria, protists, fungi and metazoans. The analysis reveals that bacteria, protists and fungi exhibit a strong spatial structure, which matches the topographical features of the plot, while metazoans do not, con-firming that microbial diversity is primarily controlled by environmental variation at the studied scale. We conclude that LDA is a sensitive, robust and computationally efficient method to detect and interpret the structure of large DNA-based biodiver-sity data sets. We finally discuss the possible future applications of this approach for the study of biodiversity