22 research outputs found

    On the benefits of clustering approaches in digital soil mapping: an application example concerning soil texture regionalization

    Get PDF
    High-resolution soil maps are urgently needed by land managers and researchers for a variety of applications. Digital soil mapping (DSM) allows us to regionalize soil properties by relating them to environmental covariates with the help of an empirical model. In this study, a legacy soil dataset was used to train a machine learning algorithm in order to predict the particle size distribution within the catchment of the Bode River in Saxony-Anhalt (Germany). The random forest ensemble learning method was used to predict soil texture based on environmental covariates originating from a digital elevation model, land cover data and geologic maps. We studied the usefulness of clustering applications in addressing various aspects of the DSM procedure. To improve areal representativity of the legacy soil data in terms of spatial variability, the environmental covariates were used to cluster the landscape of the study area into spatial units for stratified random sampling. Different sampling strategies were used to create balanced training data and were evaluated on their ability to improve model performance. Clustering applications were also involved in feature selection and stratified cross-validation. Under the best-performing sampling strategy, the resulting models achieved an R2 of 0.29 to 0.50 in topsoils and 0.16-0.32 in deeper soil layers. Overall, clustering applications appear to be a versatile tool to be employed at various steps of the DSM procedure. Beyond their successful application, further application fields in DSM were identified. One of them is to find adequate means to include expert knowledge. © Copyright

    Probenahme mittels clhs - Konzept und Einschränkungen

    Get PDF
    „Conditioned latin hypercube sampling“ (clhs) hat sich zu einem Standardansatz für die räumlich repräsentative Probenahme entwickelt. Es beruht auf dem „latin hypercube sampling“ (lhs)- Algorithmus. Gemäß diesem wird aus jeder von n Variablen eine Stichprobe der Größe k gezogen, so dass die Dichtefunktion der jeweiligen Variablen gut repräsentiert wird. Dies wird erreicht, indem die Dichtefunktion jeder Variable in k Quantile unterteilt und dann zufällig eine Probe pro Quantil gezogen wird. Anschließend werden die so erhaltenen k Werte jeder Variable mit denjenigen der übrigen Variablen entweder zufällig oder auf andere Weise kombiniert. Sofern jedoch diese Variablen die Bodenbildungsfaktoren in einer realen Landschaft repräsentieren (vergleiche clhs), führt die Auswahl eines bestimmten Wertes einer Variablen simultan zur Auswahl von Werten in den anderen Variablen, also zur Auswahl einer bestimmten Landschaftsposition. Um dennoch eine Stichprobe mit genau einer Probe je Quantil je Variable zu erhalten, ist ein mathematischer Optimierungsansatz notwendig. Um die Anwendung von clhs weiter voran zu treiben und insbesondere Probleme zu beheben, die durch die Auswahl physisch mitunter schwer erreichbarer Standorte entstehen, wurden mehrere Anpassungen vorgenommen. Andere Einschränkungen des Algorithmus blieben hingegen weitgehend unbeachtet: So haben die Werte, die in die verschiedenen Quantile einer Variable fallen, nicht die gleiche Wahrscheinlichkeit ausgewählt zu werden, eine Verletzung des lhs-Ansatzes. Ein Problem, das noch verstärkt wird, wenn mehr Variablen berücksichtigt werden oder mehr Probenahmepunkte ausgewählt werden. Auch wenn die Stichprobe in clhs nach wie vor zufällig gezogen wird, sind zudem die ausgewählten Punkte als Folge des Optimierungsprozesses nicht unabhängig voneinander. Und schließlich können aufgrund der Auswahl einer Wertekombination wichtige andere Landschaftspositionen nicht beprobt werden, so dass sie weder in der Stichprobe enthalten sind noch im mit diesem Datensatz erstellten Modell. Die Fähigkeit des clhs die Heterogenität und damit die Pedodiversität einer Landschaft zu erfassen, ist also sehr begrenzt, denn die hier gezogene Stichprobe zeigt eine zu stark vereinfachte Version der Realität und führt daher höchstwahrscheinlich zu verzerrten Modellen. Stratifizierte Zufallsstichprobenverfahren, die beispielsweise auf Methoden der Mustererkennung beruhen, sind für diesen Zweck besser geeignet

    Community dynamics under environmental change: How can next generation mechanistic models improve projections of species distributions?

    No full text
    Artículo de publicación ISItEnvironmental change is expected to shift the geographic range of species and communities. Toestimate the consequences of these shifts for the functioning and stability of ecosystems, reliablepredictions of alterations in species distributions are needed. Projections with correlative species dis-tribution models, which correlate species’ distributions to the abiotic environment, have become astandard approach. Criticism of this approach centres around the omission of relevant biotic feed-backs and triggered the search for alternatives. A new generation of mechanistic process-basedspecies distribution models aims at implementing formulations of relevant biotic processes to coverspecies’ life histories, physiology, dispersal abilities, evolution, and both intra- and interspecific interac-tions. Although this step towards more structural realism is considered important, it remains unclearwhether the resulting projections are more reliable. Structural realism has the advantage that geo-graphic range shifting emerges from the interplay of relevant abiotic and biotic processes. Havingimplemented the relevant response mechanisms, structural realistic models should better tackle thechallenge of generating projections of species responses to (non-analogous) environmental change.However, reliable projections of future species ranges demand ecological information that is cur-rently only available for few species. In this opinion paper, we discuss how the discrepancy betweendemand for structural realism on the one hand and the related knowledge gaps on the other handaffects the reliability of mechanistic species distribution models. We argue that omission of rele-vant processes potentially impairs projection accuracy (proximity of the mean outcome to the truevalue), particularly if species range shifts emerge from species and community dynamics. Yet, insuf-ficient knowledge that limits model specification and parameterization, as well as process complexity.sDiv Synthesis Centre for Biodiversity Sciences within the German Centre for Integrative Biodiversity Research (iDiv) Halle-Jena-Leipzig (DFG) FZT 118 CONICYT-PAI 82130046 FP7 projects SCALES 226852 EU BON 30845
    corecore