    The EnMAP Managed Vegetation Scientific Processor

    Nach jahrelanger wissenschaftlicher und technischer Vorbereitungszeit wird voraussichtlich Ende des Jahres 2020 der Start der orbitalen Phase einer unbemannten deutschen Weltraum-Mission initiiert. Das Environmental Mapping and Analysis Program (EnMAP) wird an Bord des gleichnamigen Satelliten einen hyperspektralen Sensor zur Erfassung terrestrischer Oberflächen tragen. In den Umweltdisziplinen zur Erforschung von Ökosystemen, landwirtschaftlicher, forstwirtschaftlicher und urbaner Flächen, im Bereich der Küsten- und Inlandsgewässer sowie der Geologie und Bodenkunde bereitete man sich im Vorfeld des Starts auf die kommenden Daten vor. Zwar existiert bereits eine Vielzahl an Algorithmen zur wissenschaftlichen Analyse von spektralen Daten, allerdings ergeben sich auch neue Herausforderungen, da die EnMAP-Mission bislang im weltweiten Kontext der Fernerkundung einzigartig ist. Die Abdeckung des vollen optischen Spektrums (420 nm – 2450 nm) in Verbindung mit einer moderaten räumlichen Auflösung von 30 m und einem hohen Signal-Rausch-Verhältnis von mindestens 180 im kurzwelligen Infrarot und über 400 im sichtbaren Spektrum, ermöglichen eine Aufnahmequalität, die bislang nur von flugzeuggestützten Systemen erreicht werden konnte. Die Bemühungen in dieser Dissertation umfassen Aktivitäten in der wissenschaftlichen Vorbereitungsphase zu agrargeographischen Fragestellungen. Algorithmen und Tools zur Analyse der hyperspektralen Daten werden kostenlos im QGIS-Plugin EnMAP-Box 3 zur Verfügung gestellt. Die drängenden Fragen im Agrarsektor drehen sich hierbei um die Ableitung biochemischer und biophysikalischer Parameter aus Fernerkundungsdaten, weshalb die übergeordnete Problemstellung des Promotionsvorhabens die Entwicklung eines wissenschaftsbasierten EnMAP-Tools für bewirtschaftete Vegetationsflächen (EnMAP Managed Vegetation Scientific Processor) darstellt. Zu Beginn wurde eine umfassende Feldkampagne geplant, welche ab April 2014 umgesetzt wurde. Neben der spektralen Erfassung von Blatt-, Bestands- und Bodensignaturen in einem Winterweizen- und einem Maisfeld erfolgte auch die Messung wesentlicher Pflanzenparameter an den exakt gleichen Positionen. Hierzu zählt die non-destruktive Ableitung des Blattflächenindex (LAI), des Blattchlorophyllgehalts (Ccab), des Blattwassergehalts (EWT oder Cw), des relativen Blatttrockengewichts (LMA oder Cm), des mittleren Blattneigungswinkels im Bestand (ALIA) sowie weiterer sekundärer Parameter wie Wuchshöhe, das phänologisches Stadium und der Sonnenvektor. Um die Fähigkeit des späteren EnMAP-Satelliten sich um bis zu 30° orthogonal zur Flugrichtung zu kippen nachzustellen, wurden die spektralen Aufnahmen aus verschiedenen Betrachtungswinkeln erstellt, die dieser Aufnahme-Geometrien nachempfunden sind. Ein gängiges Verfahren zur Ableitung der relevanten Pflanzenparameter ist die Verwendung des Strahlungstransfermodells PROSAIL, welches das spektrale Signal einer Vegetationsfläche auf Basis der zugrundeliegenden biophysikalischen und biochemischen Parameter simuliert. Bei der Umkehr dieses Prozesses können ebendiese Variablen von gemessenen spektralen Daten abgeleitet werden. Hierzu wurde eine Datenbank (Look-Up-Table, LUT) aus PROSAIL-Modellläufen aufgebaut und die in den Feldkampagnen gemessenen Spektren mit dieser abgeglichen. Mit dieser Methode der LUT-Invertierung aus unterschiedlichen Aufnahmewinkeln konnten Genauigkeiten bei der LAI-Schätzung von 18 % und bei Blattchlorophyll von 20 % erzielt werden. Eine starke Anisotropie, also eine Reflexionsabhängigkeit von der Beleuchtungs- und Aufnahmerichtung, wurde bei Winterweizen vor allem für frühe Entwicklungsstadien festgestellt. Bei einer anschließenden Studie zur Unsicherheitsanalyse des Spektralmodells wurden PROSAIL-Ergebnisse, bei denen real gemessene Pflanzenparameter als Input dienten, den zugehörigen Reflektanzspektren gegenübergestellt. Es zeigten sich hierbei mitunter starke Abweichungen zwischen gemessenen und modellierten Spektren, die im Falle des Winterweizens einen saisonalen Verlauf zeichneten. Vor allem während frühen Wachstumsstadien tendierte das Modell dazu die Reflektanz im nahen Infrarot zu überschätzen, während es gegen Ende der Wachstumsperiode eher eine Unterschätzung aufwies. Als Unsicherheitsfaktor wurde die Parametrisierung des Modells ausgemacht, wenn der ALIA-Parameter als echter physikalische Blattwinkel interpretiert wird. Es wurde geschlussfolgert, dass eine Separierung von LAI und ALIA bei der Invertierung von PROSAIL eine korrekte Abschätzung der weniger sensitiven Parameter behindert. Die Erstellung des Vegetations-Prozessors erforderte die Verwendung von Regressions-Algorithmen des maschinellen Lernens (MLRA), da eine Verteilung von großen LUTs an die User nicht praktikabel wäre. Die MLRAs wurden an synthetischen Datensätzen trainiert, wobei zunächst die Optimierung der Hyperparameter im Vordergrund stand, bevor die Anwendung an echten Spektraldaten unternommen wurde. Es konnten dabei erst aussagekräftige Ergebnisse produziert werden, als die Trainingsdaten mit einem künstlichen Rauschen belegt wurden, da die Algorithmen unter einer Überanpassung an die Modellumgebung litten. Mithilfe des Prozessors konnten schließlich LAI, ALIA, Ccab und Cw aus hyperspektralen Daten abgeleitet werden. Künstliche neuronale Netze dienen dabei als Blackbox-Modelle, die in kurzer Zeit große Datenmengen verarbeiten können und somit einen entscheidenden Beitrag zur modernen angewandten Fernerkundung für eine breite User-Community leisten.After years of scientific and technical preparation, the launch of an unmanned German space-mission is planned to be initiated in 2020. The Environmental Mapping and Analysis Program (EnMAP) is going to provide an equally named hyperspectral imager to map land surfaces. Scientists of environmental disciplines of monitoring of ecosystems, agricultural, forestry and urban areas as well as coastal and inland waters, geology and soils prepared themselves for the upcoming data prior to the actual launch. Although there already exists a variety of useful algorithms for a profound analysis of spectral data, new challenges will arise given the uniqueness of the EnMAP-mission in the global context of remote sensing; i.e. coverage of the full range of the optical spectrum (420 nm – 2450 nm) in combination with a moderate spatial resolution of 30 m and a high signal-to-noise ratio of at least 180 in the shortwave infrared and above 400 in the visible spectrum. This enables an imaging quality which to this date has only been reached by airborne systems. The efforts of this dissertation comprise activities in the scientific preparation phase for agro-geographical tasks. Algorithms and tools for an analysis of hyperspectral data are being provided for free in the QGIS-plugin EnMAP-Box 3. Urgent questions in the agricultural sector revolve around the derivation of biochemical and biophysical parameters from remote sensing data. For this reason, the overarching objective of this promotion is the development of a scientific EnMAP-tool for managed areas of vegetation (EnMAP Managed Vegetation Scientific Processor). At first, an extensive field campaign was planned and then started in April, 2014. Apart from spectral observations of leaves, canopies and soils in a winter wheat and a maize field, also relevant plant parameters were acquired at the exact same spots. Namely, they are the Leaf Area Index (LAI), leaf chlorophyll content (Ccab), leaf water content (EWT or Cw), relative dry leaf weight (LMA or Cm), Average Leaf Inclination Angle (ALIA) as well as other secondary parameters like canopy height, phenological stage and the solar vector. Spectral measurements were captured from different observation angles to match ground data with the sensing geometry of the future EnMAP-satellite, which can be tilted up to 30° orthogonal to its direction of flight. A common procedure to derive relevant crop parameters is to make use of the radiative transfer model PROSAIL, which simulates the spectral signal of a vegetated surface based on biophysical and biochemical input parameters. If this process is reverted, said parameters can be derived from measured spectral data. To do so, a Look-Up-Table (LUT) is built containing model runs of PROSAIL and then subsequently compared against spectra from the field campaigns. With this approach of LUT-inversions from different observation angles, an accuracy of 18 % could be achieved for LAI and 20 % for Ccab. Strong anisotropic effects, i.e. dependence on illumination geometry and sensor orientation, were identified for winter wheat mainly in the early stages of plant development. In a consecutive study about uncertainties of the spectral model, PROSAIL results fed with in situ measured crop parameters as input, were opposed to their associated reflectance signatures. A strong deviation between measured and modelled spectra was observed, which – in the case of winter wheat – showed a seasonal behavior. The model tended to overestimate reflectances in the near infrared for early phenological stages and to underestimate them at end of the growing period. The parametrization of the model was identified as an uncertainty factor if the ALIA parameter is interpreted as true physical leaf inclinations. It was concluded that a separation of LAI and ALIA at inversion of PROSAIL prevents an adequate estimation of the less sensitive parameters. The development of the vegetation processor required the use of Machine Learning Regression Algorithms (MLRA), since distribution of large LUTs to the user would be impracticable. The MLRAs were trained with synthetic datasets with primary importance to optimize their hyperparameters, before attempting to apply the algorithms to real spectral data. Significant results could not be obtained until training data were altered with artificial noise, because algorithms suffered from overfitting to the model environment. Executing the processor allowed to derive LAI, ALIA, Ccab and Cw from hyperspectral data. Artificial neural networks served as black box models, which digest great amount of data in a short period of time and thus make a decisive contribution to modern applied remote sensing with relevance for a broad user-community

    Unlocking the benefits of spaceborne imaging spectroscopy for sustainable agriculture

    With the Environmental Mapping and Analysis Program (EnMAP) mission, launched on April 1st 2022, new opportunities unfold for precision farming and agricultural monitoring. The recurring acquisition of spectrometric imagery from space, contiguously resolving the electromagnetic spectrum in the optical domain (400—2500 nm) within close narrow bands, provides unprecedented data about the interaction of radiation with biophysical and biochemical crop constituents. These interactions manifest in spectral reflectance, carrying important information about crop status and health. This information may be incorporated in agricultural management systems to support necessary efforts to maximize yields against the backdrop of an increased food demand by a growing world population. At the same time, it enables the effective optimization of fertilization and pest control to minimize environmental impacts of agriculture. Deriving biophysical and biochemical crop traits from hyperspectral reflectance thereby always relies on a model. These models are categorized into (1) parametric, (2) nonparametric, (3) physically-based, and (4) hybrid retrieval schemes. Parametric methods define an explicit parameterized expression, relating a number of spectral bands or derivates thereof with a crop trait of interest. Nonparametric methods comprise linear techniques, such as principal component analysis (PCA) which addresses collinearity issues between adjacent bands and enables compression of full spectral information into dimensionality reduced, maximal informative principal components (PCs). Nonparametric nonlinear methods, i.e., machine learning (ML) algorithms apply nonlinear transformations to imaging spectroscopy data and are therefore capable of capturing nonlinear relationships within the contained spectral features. Physically-based methods represent an umbrella term for radiative transfer models (RTMs) and related retrieval schemes, such as look-up-table (LUT) inversion. A simple, easily invertible and specific RTM is the Beer-Lambert law which may be used to directly infer plant water content. The most widely used general and invertible RTM is the one-dimensional canopy RTM PROSAIL, which is coupling the Leaf Optical Properties Spectra model PROSPECT and the canopy reflectance model 4SAIL: Scattering by Arbitrarily Inclined Leaves. Hybrid methods make use of synthetic data sets created by RTMs to calibrate parametric methods or to train nonparametric ML algorithms. Due to the ill-posed nature of RTM inversion, potentially unrealistic and redundant samples in a LUT need to be removed by either implementing physiological constraints or by applying active learning (AL) heuristics. This cumulative thesis presents three different hybrid approaches, demonstrated within three scientific research papers, to derive agricultural relevant crop traits from spectrometric imagery. In paper I the Beer-Lambert law is applied to directly infer the thickness of the optically active water layer (i.e., EWT) from the liquid water absorption feature at 970 nm. The model is calibrated with 50,000 PROSPECT spectra and validated over in situ data. Due to separate water content measurements of leaves, stalks, and fruits during the Munich-North-Isar (MNI) campaigns, findings indicate that depending on the crop type and its structure, different parts of the canopy are observed with optical sensors. For winter wheat, correlation between measured and modelled water content was most promising for ears and leaves, reaching coefficients of determination (R2) up to 0.72 and relative RMSE (rRMSE) of 26%, and in the case of corn for the leaf fraction only (R2 = 0.86, rRMSE = 23%). These results led to the general recommendation to collect destructive area-based plant organ specific EWT measurements instead of the common practice to upscale leaf-based EWT measurements to canopy water content (CWC) by multiplication of the leaf area index (LAI). The developed and calibrated plant water retrieval (PWR) model proved to be transferable in space and time and is ready to be applied to upcoming EnMAP data and any other hyperspectral imagery. In paper II the parametric concept of spectral integral ratios (SIR) is introduced to retrieve leaf chlorophyll a and b content (Cab), leaf carotenoid content (Ccx) and leaf water content (Cw) simultaneously from imaging spectroscopy data in the wavelength range 460—1100 nm. The SIR concept is based on automatic separation of respective absorption features through local peak and intercept analysis between log-transformed reflectance and convex hulls. The approach was validated over a physiologically constrained PROSAIL simulated database, considering natural Ccx-Cab relations and green peak locations. Validation on airborne spectrometric HyMAP data achieved satisfactory results for Cab (R2 = 0.84; RMSE = 9.06 µg cm-2) and CWC (R2 = 0.70; RMSE = 0.05 cm). Retrieved Ccx values were reasonable according to Cab-Ccx-dependence plausibility analysis. Mapping of the SIR results as multiband images (3-segment SIR) allows for an intuitive visualization of dominant absorptions with respect to the three considered biochemical variables. Hence, the presented SIR algorithm allows for computationally efficient and RTM supported robust retrievals of the two most important vegetation pigments as well as of water content and is applicable on satellite imaging spectroscopy data. In paper III a hybrid workflow is presented, combining RTM with ML for inferring crop carbon content (Carea) and aboveground dry and fresh biomass (AGBdry, AGBfresh). The concept involves the establishment of a PROSAIL training database, dimensionality reduction using PCA, optimization in the sampling domain using AL against the 4-year MNI campaign dataset, and training of Gaussian process regression (GPR) ML algorithms. Internal validation of the GPR-Carea and GPR-AGB models achieved R2 of 0.80 for Carea, and R2 of 0.80 and 0.71 for AGBdry and AGBfresh, respectively. Validation with an independent dataset, comprising airborne AVIRIS NG imagery (spectrally resampled to EnMAP) and in situ measurements, successfully demonstrated mapping capabilities for both bare and green fields and generated reliable estimates over winter wheat fields at low associated model uncertainties (< 40%). Overall, the proposed carbon and biomass models demonstrate a promising path toward the inference of these crucial variables over cultivated areas from upcoming spaceborne hyperspectral acquisitions, such as from EnMAP. As conclusions, the following important findings arise regarding parametric and nonparametric hybrid methods as well as in view of the importance of in situ data collection. (1) Uncertainties within the RTM PROSAIL should always be considered. A possible reduction of these uncertainties is thereby opposed to the invertibility of the model and its intended simplicity. (2) Both physiological constraints and AL heuristics should be applied to reduce unrealistic parameter combinations in a PROSAIL calibration or training database. (3) State-of-the-art hybrid ML approaches with the ability to provide uncertainty intervals are anticipated as most promising approach for solving inference problems from hyperspectral Earth observation data due to their synergistic use of RTMs and the high flexibility, accuracy and consistency of nonlinear nonparametric methods. (4) Parametric hybrid approaches, due to their algorithmic transparency, enable deeper insights into fundamental physical limitations of optical remote sensing as compared to ML approaches. (5) Integration-based indices that make full use of available hyperspectral information may serve as physics-aware dimensionality reduced input for ML algorithms to either improve estimations or to serve as endmember for crop type discrimination when additional time series information is available. (6) The validation of quantitative model-based estimations is crucial to evaluate and improve their performance in terms of the underlying assumptions, model parameterizations, and input data. (7) In the face of soon-to-be-available EnMAP data, collection of in situ data for validation of retrieval methods should aim at high variability of measured crop types, high temporal variability over the whole growing season, as well as include area- and biomass-based destructive measurements instead of LAI-upscaled leaf measurements. Provided the perfect functionality of the payload instruments, the success of the EnMAP mission and the here presented methods depend critically on a low-noise, accurate atmospherically corrected reflectance product. High-level outputs of the retrieval methods presented in this thesis may be incorporated into agricultural decision support systems for fertilization and irrigation planning, yield estimation, or estimation of the soil carbon sequestration potential to enable a sustainable intensive agriculture in the future.Mit der am 1. April 2022 gestarteten Satellitenmission Environmental Mapping and Analysis Program (EnMAP) eröffnen sich neue Möglichkeiten für die Präzisionslandwirtschaft und das landwirtschaftliche Monitoring. Die wiederkehrende Erfassung spektrometrischer Bilder aus dem Weltraum, welche das elektromagnetische Spektrum im optischen Bereich (400—2500 nm) innerhalb von engen, schmalen Bändern zusammenhängend auflösen, liefert nie dagewesene Daten über die Interaktionen von Strahlung und biophysikalischen und biochemischen Pflanzenbestandteilen. Diese Wechselwirkungen manifestieren sich in der spektralen Reflektanz, die wichtige Informationen über den Zustand und die Gesundheit der Pflanzen enthält. Vor dem Hintergrund einer steigenden Nachfrage nach Nahrungsmitteln durch eine wachsende Weltbevölkerung können diese Informationen in landwirtschaftliche Managementsysteme einfließen, um eine notwendige Ertragsmaximierung zu unterstützen. Gleichzeitig können sie eine effiziente Optimierung der Düngung und Schädlingsbekämpfung ermöglichen, um die Umweltauswirkungen der Landwirtschaft zu minimieren. Die Ableitung biophysikalischer und biochemischer Pflanzeneigenschaften aus hyperspektralen Reflektanzdaten ist dabei immer von einem Modell abhängig. Diese Modelle werden in (1) parametrische, (2) nichtparametrische, (3) physikalisch basierte und (4) hybride Ableitungsmethoden kategorisiert. Parametrische Methoden definieren einen expliziten parametrisierten Ausdruck, der eine Reihe von Spektralkanälen oder deren Ableitungen mit einem Pflanzenmerkmal von Interesse in Beziehung setzt. Nichtparametrische Methoden umfassen lineare Techniken wie die Hauptkomponentenanalyse (PCA). Diese adressieren Kollinearitätsprobleme zwischen benachbarten Kanälen und komprimieren die gesamte Spektralinformation in dimensionsreduzierte, maximal informative Hauptkomponenten (PCs). Nichtparametrische nichtlineare Methoden, d. h. Algorithmen des maschinellen Lernens (ML), wenden nichtlineare Transformationen auf bildgebende Spektroskopiedaten an und sind daher in der Lage, nichtlineare Beziehungen innerhalb der enthaltenen spektralen Merkmale zu erfassen. Physikalisch basierte Methoden sind ein Oberbegriff für Strahlungstransfermodelle (RTM) und damit verbundene Ableitungsschemata, d. h. Invertierungsverfahren wie z. B. die Invertierung mittels Look-up-Table (LUT). Ein einfaches, leicht invertierbares und spezifisches RTM stellt das Lambert-Beer'sche Gesetz dar, das zur direkten Ableitung des Wassergehalts von Pflanzen verwendet werden kann. Das am weitesten verbreitete, allgemeine und invertierbare RTM ist das eindimensionale Bestandsmodell PROSAIL, eine Kopplung des Blattmodells Leaf Optical Properties Spectra (PROSPECT) mit dem Bestandsreflexionsmodell 4SAIL (Scattering by Arbitrarily Inclined Leaves). Bei hybriden Methoden werden von RTMs generierte, synthetische Datenbanken entweder zur Kalibrierung parametrischer Methoden oder zum Training nichtparametrischer ML-Algorithmen verwendet. Aufgrund der Äquifinalitätsproblematik bei der RTM-Invertierung, müssen potenziell unrealistische und redundante Simulationen in einer solchen Datenbank durch die Implementierung natürlicher physiologischer Beschränkungen oder durch die Anwendung von Active Learning (AL) Heuristiken entfernt werden. In dieser kumulativen Dissertation werden drei verschiedene hybride Ansätze zur Ableitung landwirtschaftlich relevanter Pflanzenmerkmale aus spektrometrischen Bilddaten vorgestellt, die anhand von drei wissenschaftlichen Publikationen demonstriert werden. In Paper I wird das Lambert-Beer'sche Gesetz angewandt, um die Dicke der optisch aktiven Wasserschicht (bzw. EWT) direkt aus dem Absorptionsmerkmal von flüssigem Wasser bei 970 nm abzuleiten. Das Modell wird mit 50.000 PROSPECT-Spektren kalibriert und anhand von In-situ-Daten validiert. Aufgrund separater Messungen des Wassergehalts von Blättern, Stängeln und Früchten während der München-Nord-Isar (MNI)-Kampagnen, zeigen die Ergebnisse, dass je nach Kulturart und -struktur, unterschiedliche Teile des Bestandes mit optischen Sensoren beobachtet werden können. Bei Winterweizen wurde die höchste Korrelation zwischen gemessenem und modelliertem Wassergehalt für Ähren und Blätter erzielt und sie erreichte Bestimmtheitsmaße (R2) von bis zu 0,72 bei einem relativen RMSE (rRMSE) von 26%, bei Mais entsprechend nur für die Blattfraktion (R2 = 0,86, rRMSE = 23%). Diese Ergebnisse führten zu der allgemeinen Empfehlung, Kompartiment-spezifische EWT-Bestandsmessungen zu erheben, anstatt der üblichen Praxis, blattbasierte EWT-Messungen durch Multiplikation mit dem Blattflächenindex (LAI) auf den Bestandswassergehalt (CWC) hochzurechnen. Das entwickelte und kalibrierte Modell zur Ableitung des Pflanzenwassergehalts (PWR) erwies sich als räumlich und zeitlich übertragbar und kann auf bald verfügbare EnMAP-Daten und andere hyperspektrale Bilddaten angewendet werden. In Paper II wird das parametrische Konzept der spektralen Integralratios (SIR) eingeführt, um den Chlorophyll a- und b-Gehalt (Cab), den Karotinoidgehalt (Ccx) und den Wassergehalt (Cw) simultan aus bildgebenden Spektroskopiedaten im Wellenlängenbereich 460-1100 nm zu ermitteln. Das SIR-Konzept basiert auf der automatischen Separierung der jeweiligen Absorptionsmerkmale durch lokale Maxima- und Schnittpunkt-Analyse zwischen log-transformierter Reflektanz und konvexen Hüllen. Der Ansatz wurde anhand einer physiologisch eingeschränkten PROSAIL-Datenbank unter Berücksichtigung natürlicher Ccx-Cab-Beziehungen und Positionen der Maxima im grünen Wellenlängenbereich validiert. Die Validierung mit flugzeuggestützten spektrometrischen HyMAP-Daten ergab zufriedenstellende Ergebnisse für Cab (R2 = 0,84; RMSE = 9,06 µg cm-2) und CWC (R2 = 0,70; RMSE = 0,05 cm). Die ermittelten Ccx-Werte wurden anhand einer Plausibilitätsanalyse entsprechend der Cab-Ccx-Abhängigkeit als sinnvoll bewertet. Die Darstellung der SIR-Ergebnisse als mehrkanalige Bilder (3 segment SIR) ermöglicht zudem eine auf die drei betrachteten biochemischen Variablen bezogene, intuitive Visualisierung der dominanten Absorptionen. Der vorgestellte SIR-Algorithmus ermöglicht somit wenig rechenintensive und RTM-gestützte robuste Ableitungen der beiden wichtigsten Pigmente sowie des Wassergehalts und kann in auf jegliche zukünftig verfügbare Hyperspektraldaten angewendet werden. In Paper III wird ein hybrider Ansatz vorgestellt, der RTM mit ML kombiniert, um den Kohlenstoffgehalt (Carea) sowie die oberirdische trockene und frische Biomasse (AGBdry, AGBfresh) abzuschätzen. Das Konzept umfasst die Erstellung einer PROSAIL-Trainingsdatenbank, die Dimensionsreduzierung mittels PCA, die Reduzierung der Stichprobenanzahl mittels AL anhand des vier Jahre umspannenden MNI-Kampagnendatensatzes und das Training von Gaussian Process Regression (GPR) ML-Algorithmen. Die interne Validierung der GPR-Carea und GPR-AGB-Modelle ergab einen R2 von 0,80 für Carea und einen R2 von 0,80 bzw. 0,71 für AGBdry und AGBfresh. Die Validierung auf einem unabhängigen Datensatz, der flugzeuggestützte AVIRIS-NG-Bilder (spektral auf EnMAP umgerechnet) und In-situ-Messungen umfasste, zeigte erfolgreich die Kartierungsfähigkeiten sowohl für offene Böden als auch für grüne Felder und führte zu zuverlässigen Schätzungen auf Winterweizenfeldern bei geringen Modellunsicherheiten (< 40%). Insgesamt zeigen die vorgeschlagenen Kohlenstoff- und Biomassemodelle einen vielversprechenden Ansatz auf, der zur Ableitung dieser wichtigen Variablen über Anbauflächen aus künftigen weltraumgestützten Hyperspektralaufnahmen wie jenen von EnMAP genutzt werden kann. Als Schlussfolgerungen ergeben sich die folgenden wichtigen Erkenntnisse in Bezug auf parametrische und nichtparametrische Hybridmethoden sowie bezogen auf die Bedeutung der In-situ-Datenerfassung. (1) Unsicherheiten innerhalb des RTM PROSAIL sollten immer berücksichtigt werden. Eine mögliche Verringerung dieser Unsicherheiten steht dabei der Invertierbarkeit des Modells und dessen beabsichtigter Einfachheit entgegen. (2) Sowohl physiologische Einschränkungen als auch AL-Heuristiken sollten angewendet werden, um unrealistische Parameterkombinationen in einer PROSAIL-Kalibrierungs- oder Trainingsdatenbank zu reduzieren. (3) Modernste ML-Ansätze mit der Fähigkeit, Unsicherheitsintervalle bereitzustellen, werden als vielversprechendster Ansatz für die Lösung von Inferenzproblemen aus hyperspektralen Erdbeobachtungsdaten aufgrund ihrer synergetischen Nutzung von RTMs und der hohen Flexibilität, Genauigkeit und Konsistenz nichtlinearer nichtparametrischer Methoden angesehen. (4) Parametrische hybride Ansätze ermöglichen aufgrund ihrer algorithmischen Transparenz im Vergleich zu ML-Ansätzen tiefere Einblicke in die grundlegenden physikalischen Grenzen der optischen Fernerkundung. (5) Integralbasierte Indizes, die die verfügbare hyperspektrale Information voll ausschöpfen, können als physikalisch-basierte dimensionsreduzierte Inputs für ML-Algorithmen dienen, um entweder Schätzungen zu verbessern oder um als Eingangsdaten die verbesserte Unterscheidung von Kulturpflanzen zu ermöglichen, sobald zusätzliche Zeitreiheninformationen verfügbar sind. (6) Die Validierung quantitativer modellbasierter Schätzungen ist von entscheidender Bedeutung für die Bewertung und Verbesserung ihrer Leistungsfähigkeit in Bezug auf die zugrunde liegenden Annahmen, Modellparametrisierungen und Eingabedaten. (7) Angesichts der bald verfügbaren EnMAP-Daten sollte die Erhebung von In-situ-Daten zur Validierung von Ableitungsmethoden auf eine hohe Variabilität der gemessenen Pflanzentypen und eine hohe zeitliche Variabilität über die gesamte Vegetationsperiode abzielen sowie flächen- und biomassebasierte destruktive Messungen anstelle von LAI-skalierten Blattmessungen umfassen. Unter der Voraussetzung, dass die Messinstrumente perfekt funktionieren, hängt der Erfolg der EnMAP-Mission und der hier vorgestellten Methoden entscheidend von einem rauscharmen, präzise atmosphärisch korrigierten Reflektanzprodukt ab. Die Ergebnisse der in dieser Arbeit vorgestellten Methoden können in landwirtschaftliche Entscheidungsunterstützungssysteme für die Dünge- oder Bewässerungsplanung, die Ertragsabschätzung oder die Schätzung des Potenzials der Kohlenstoffbindung im Boden integriert werden, um eine nachhaltige Intensivlandwirtschaft in der Zukunft zu ermöglichen

    Radiative transfer model inversion using high-resolution hyperspectral airborne imagery – Retrieving maize LAI to access biomass and grain yield

    Mapping crop within-field yield variability provide an essential piece of information for precision agriculture applications. Leaf Area Index (LAI) is an important parameter that describes maize growth, vegetation structure, light absorption and subsequently maize biomass and grain yield (GY). The main goal for this study was to estimate maize biomass and GY through LAI retrieved from hyperspectral aerial images using a PROSAIL model inversion and compare its performance with biomass and GY estimations through simple vegetation index approaches. This study was conducted in two separate maize fields of 12 and 20 ha located in north-west Mexico. Both fields were cultivated with the same hybrid. One field was irrigated by a linear pivot and the other by a furrow irrigation system. Ground LAI data were collected at different crop growth stages followed by maize biomass and GY at the harvesting time. Through a weekly/biweekly airborne flight campaign, a total of 19 mosaics were acquired between both fields with a micro-hyperspectral Vis-NIR imaging sensor ranging from 400 to 850 nanometres (nm) at different crop growth stages. The PROSAIL model was calibrated and validated for retrieving maize LAI by simulating maize canopy spectral reflectance based on crop-specific parameters. The model was used to retrieve LAI from both fields and to subsequently estimate maize biomass and GY. Additionally, different vegetation indices were calculated from the aerial images to also estimate maize yield and compare the indices with PROSAIL based estimations. The PROSAIL validation to retrieve LAI from hyperspectral imagery showed a R² value of 0.5 against ground LAI with RMSE of 0.8 m²/m². Maize biomass and GY estimation based on NDRE showed the highest accuracies, followed by retrieved LAI, GNDVI and NDVI with R² value of 0.81, 0.73, 0.73 and 0.65 for biomass, and 0.83, 0.69, 0.73 and 0.62 for GY estimation, respectively. Furthermore, the late vegetative growth stage at V16 was found to be the best stage for maize yield prediction for all studied indices

    Seasonal mapping of irrigated winter wheat traits in Argentina with a hybrid retrieval workflow using sentinel-2 imagery

    Earth observation offers an unprecedented opportunity to monitor intensively cultivated areas providing key support to assess fertilizer needs and crop water uptake. Routinely, vegetation traits mapping can help farmers to monitor plant development along the crop’s phenological cycle, which is particularly relevant for irrigated agricultural areas. The high spatial and temporal resolution of the Sentinel-2 (S2) multispectral instrument leverages the possibility to estimate leaf area index (LAI), canopy chlorophyll content (CCC), and vegetation water content (VWC) from space. Therefore, our study presents a hybrid retrieval workflow combining a physically-based strategy with a machine learning regression algorithm, i.e., Gaussian processes regression, and an active learning technique to estimate LAI, CCC and VWC of irrigated winter wheat. The established hybrid models of the three traits were validated against in-situ data of a wheat campaign in the Bonaerense valley, South of the Buenos Aires Province, Argentina, in the year 2020. We obtained good to highly accurate validation results with LAI: R2 = 0.92, RMSE = 0.43 m2 m−2, CCC: R2 = 0.80, RMSE = 0.27 g m−2 and VWC: R2 = 0.75, RMSE = 416 g m−2. The retrieval models were also applied to a series of S2 images, producing time series along the seasonal cycle, which reflected the effects of fertilizer and irrigation on crop growth. The associated uncertainties along with the obtained maps underlined the robustness of the hybrid retrieval workflow. We conclude that processing S2 imagery with optimised hybrid models allows accurate space-based crop traits mapping over large irrigated areas and thus can support agricultural management decisions.Fil: Caballero, Gabriel. Technological University of Uruguay (UTEC). Agri-Environmental Engineering; Uruguay. University of Valencia. Image Processing Laboratory (IPL); EspañaFil: Pezzola, Alejandro. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Hilario Ascasubi; ArgentinaFil: Winschel, Cristina Ines. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Hilario Ascasubi; ArgentinaFil: Casella, Alejandra. Instituto Nacional de Tecnología Agropecuaria (INTA). Instituto de Clima y Agua; ArgentinaFil: Sanchez Angonova, Paolo Andres. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Hilario Ascasubi; ArgentinaFil: Rivera Caicedo, Juan Pablo. CONACYT-UAN. Secretary of Research and Graduate Studies; MéxicoFil: Berger, Katja. University of Valencia. Image Processing Laboratory (IPL); España. Mantle Labs GmbH; AustriaFil: Verrelst, Jochem. University of Valencia. Image Processing Laboratory (IPL); EspañaFil: Delegido, Jesús. Universidad de Valencia. Image Processing Laboratory (IPL); Españ

    Remote sensing tools for monitoring grassland plant leaf traits and biodiversity

    Rocchini, Duccio1This project has received funding from the European Union’s Horizon 2020 Research and Innovation Program under the Marie Skłodowska-Curie Grant No. 721995 (project Trustee).openGrasslands are one of the most important ecosystems on Earth, covering approximately onethird of the Earth’s surface. Grassland biodiversity is important as many services provided by such ecosystems are crucial for the human economy and well-being. Given the importance of grasslands ecosystems, in recent years research has been carried out on the potential to monitor them with novel remote sensing techniques. Improved detectors technology and novel sensors providing finescale hyperspectral imagery have been enabling new methods to monitor plant traits (PTs) and biodiversity. The aims of the work were to study different approaches to monitor key grassland PTs such as Leaf Area Index (LAI) and biodiversity-related traits. The thesis consists of 3 parts: 1) Evaluating the performance of remote sensing methods to estimate LAI in grassland ecosystems, 2) Estimating plant biodiversity by using the optical diversity approach in grassland ecosystems, and 3) Investigating the relationship between PTs variability with alpha and beta diversity for the applicability of the optical diversity approach in a subalpine grassland of the Italian Alps To evaluate the performance of remote sensing methods to estimate LAI, temporal and spatial observations of hyperspectral reflectance and LAI were analyzed at a grassland site in Monte Bondone, Italy (IT-MBo). In 2018, ground temporal observations of hyperspectral reflectance and LAI were carried out at a grassland site in Neustift, Austria (AT-NEU). To estimate biodiversity, in 2018 and 2019 a floristics survey was conducted to determine species composition and hyperspectral data were acquired at two grassland sites: IT-MBo and University of Padova’s Experimental Farm, Legnaro, Padua, Italy (IT-PD) respectively. Furthermore, in 2018, biochemistry analysis of the biomass samples collected from the grassland site IT-MBo was carried out to determine the foliar biochemical PTs variability. The results of the thesis demonstrated that the grassland spectral response across different spectral regions (Visible: VIS, red-edge: RE, Near-infrared: NIR) showed to be both site-specific and scale-dependent. In the first part of the thesis, the performance of spectral vegetation indices (SVIs) based on visible, red-edge (RE), and NIR bands alongside SVIs solely based or NIRshoulder bands (wavelengths 750 - 900 nm) was evaluated. A strong correlation (R2 > 0.8) was observed between grassland LAI and both RE and NIR-shoulder SVIs on a temporal basis, but not on a spatial basis. Using the PROSAIL Radiative Transfer Model (RTM), it was demonstrated that grassland structural heterogeneity strongly affects the ability to retrieve LAI, with high uncertainties due to structural and biochemical PTs co-variation. In the second part, the applicability of the spectral variability hypothesis (SVH) was questioned and highlighted the challenges to use high-resolution hyperspectral images to estimate biodiversity in complex grassland ecosystems. It was reported that the relationship between biodiversity (Shannon, Richness, Simpson, and Evenness) and optical diversity metrics (Coefficient of variation (CV) and Standard deviation (SD)) is not consistent across plant communities. The results of the second part suggested that biodiversity in terms of species richness could be estimated by optical diversity metrics with an R2 = 0.4 at the IT-PD site where the grassland plots were artificially established and are showing a lower structure and complexity from the natural grassland plant communities. On the other hand, in the natural ecosystems at IT-MBo, it was more difficult to estimate biodiversity indices, probably due to structural and biochemical PTs co-variation. The 18 effects of canopy non-vegetative elements (flowers and dead material), shadow pixels, and overexposed pixels on the relationship between optical diversity metrics and biodiversity indices were highlighted. In the third part, we examined the relationship between PTs variability (at both local and community scales, measured by standard deviation and by the Euclidean distances of the biochemical and biophysical PTs respectively) and taxonomic diversity (both α-diversity and βdiversity, measured by Shannon’s index and by Jaccard dissimilarity index of the species, families, and functional groups percent cover respectively) in Monte Bondone, Trentino province, Italy. The results of the study showed that the PTs variability metrics at alpha scale were not correlated with α-diversity. However, the results at the community scale (β-diversity) showed that some of the investigated biochemical and biophysical PTs variations metrics were associated with β-diversity. The SVH approach was also tested to estimate β-diversity and we found that spectral diversity calculated by spectral angular mapper (SAM) showed to be a better proxy of biodiversity in the same ecosystem where the spectral diversity failed to estimate alpha diversity, this leading to the conclusion that the link between functional and species diversity may be an indicator of the applicability of optical sampling methods to estimate biodiversity. The findings of the thesis highlighted that grassland structural heterogeneity strongly affects the ability to retrieve both LAI and biodiversity, with high uncertainties due to structural and biochemical PTs co-variation at complex grassland ecosystems. In this context, the uncertainties of satellite-based products (e.g., LAI) in monitoring grassland canopies characterized by either spatially or temporally varying structure need to be carefully taken into account. The results of the study highlighted that the poor performance of optical diversity proxies in estimating biodiversity in structurally heterogeneous grasslands might be due to the complex relationships between functional diversity and biodiversity, rather than the impossibility to detect functional diversity with spectral proxiesopenImran, H.A

    Gaussian processes retrieval of crop traits in Google Earth Engine based on Sentinel-2 top-of-atmosphere data

    The unprecedented availability of optical satellite data in cloud-based computing platforms, such as Google Earth Engine (GEE), opens new possibilities to develop crop trait retrieval models from the local to the planetary scale. Hybrid retrieval models are of interest to run in these platforms as they combine the advantages of physically-based radiative transfer models (RTM) with the flexibility of machine learning regression algorithms. Previous research with GEE primarily relied on processing bottom-of-atmosphere (BOA) reflectance data, which requires atmospheric correction. In the present study, we implemented hybrid models directly into GEE for processing Sentinel-2 (S2) Level-1C (L1C) top-of-atmosphere (TOA) reflectance data into crop traits. To achieve this, a training dataset was generated using the leaf-canopy RTM PROSAIL in combination with the atmospheric model 6SV. Gaussian process regression (GPR) retrieval models were then established for eight essential crop traits namely leaf chlorophyll content, leaf water content, leaf dry matter content, fractional vegetation cover, leaf area index (LAI), and upscaled leaf variables (i.e., canopy chlorophyll content, canopy water content and canopy dry matter content). An important pre-requisite for implementation into GEE is that the models are sufficiently light in order to facilitate efficient and fast processing. Successful reduction of the training dataset by 78% was achieved using the active learning technique Euclidean distance-based diversity (EBD). With the EBD-GPR models, highly accurate validation results of LAI and upscaled leaf variables were obtained against in situ field data from the validation study site Munich-North-Isar (MNI), with normalized root mean square errors (NRMSE) from 6% to 13%. Using an independent validation dataset of similar crop types (Italian Grosseto test site), the retrieval models showed moderate to good performances for canopy-level variables, with NRMSE ranging from 14% to 50%, but failed for the leaf-level estimates. Obtained maps over the MNI site were further compared against Sentinel-2 Level 2 Prototype Processor (SL2P) vegetation estimates generated from the ESA Sentinels' Application Platform (SNAP) Biophysical Processor, proving high consistency of both retrievals (R2 from 0.80 to 0.94). Finally, thanks to the seamless GEE processing capability, the TOA-based mapping was applied over the entirety of Germany at 20 m spatial resolution including information about prediction uncertainty. The obtained maps provided confidence of the developed EBD-GPR retrieval models for integration in the GEE framework and national scale mapping from S2-L1C imagery. In summary, the proposed retrieval workflow demonstrates the possibility of routine processing of S2 TOA data into crop traits maps at any place on Earth as required for operational agricultural applications

    Explotación sinérgica de datos multiespectrales y radar para la estimación de variables biofísicas de la vegetación mediante tecnologías de sensoramiento remoto

    Las variables biofísicas de la vegetación (VBV) son indicadores directos del crecimiento y productividad de los cultivos. Los sistemas de observación de la Tierra (EO–Earth observation) presentan oportunidades sin precedentes para el monitoreo de las variables biofísicas del trigo. Sentinel–2 (S2) es una constelación de satélites que forma parte de las misiones Sentinel del programa Copernicus de EO. El período de revisita, así como su resolución espacial y espectral, han convertido a S2 en un sistema de EO trascendental para el monitoreo de VBV. Los sistemas ópticos de EO se ven limitados con frecuencia por las condiciones climáticas tales como nubosidad o precipitaciones. En este sentido, la tecnología radar, presenta nuevas oportunidades para el monitoreo de VBV que deben explorarse en profundidad. Sentinel–1 (S1) es una constelación radar de la familia Sentinel. Debido a la complejidad de la interacción de la señal radar con las superficies cultivadas y al ruido aditivo inherente de speckle, la estimación de VBV con tecnología radar aún sigue siendo un desafío. El objetivo de esta tesis doctoral es desarrollar modelos de estimación de variables biofísicas del trigo, en una zona irrigada de cultivo intensivo al sureste de Argentina, basados en medidas in situ de la vegetación, a partir de: i) datos multiespectrales de S2; ii) datos radar de S1; y iii) la sinergia S1 & S2. Para abordar la problemática planteada, se desarrollaron en primer lugar, modelos de estimación del índice de área foliar, del contenido de clorofila de la cubierta vegetal y del contenido de agua del trigo, utilizando una base de datos multitemporal de VBV tomadas in situ, algoritmos de aprendizaje automático, una base de datos de espectros de reflectividad bidireccional de la vegetación simulados con un modelo de transferencia radiativa y datos multiespectrales de S2. Se obtuvieron modelos híbridos de estimación de estas VBV que se ajustaron con alta precisión a los datos de campo y se logró reconstruir con éxito la curva fenológica del cultivo de trigo. En segundo lugar, se implementó un modelo de estimación de LAI basado en datos radar de S1 adquiridos en diferentes geometrías de adquisición. Se probó que la estructura tridimensional de la vegetación cuando es observada desde ángulos de incidencia local diferentes proporciona información muy valiosa que puede ser utilizada para mejorar los modelos existentes. Por último, se desarrolló una estrategia de fusión de datos de S1 & S2 para reconstruir series temporales de VWC. Se aplicaron varios modelos de procesos Gaussianos de salidas múltiples para analizar la correlación cruzada existente, en el dominio de la frecuencia, entre los canales ópticos y radar. La combinación sinérgica de datos radar y ópticos mostró ser un novedoso enfoque para abordar el monitoreo de variables biofísicas del trigo en regiones intensamente cultivadas con frecuente nubosidad