309 research outputs found
Approximation de matrices pour l’apprentissage des hyperparamètres des fonctions noyaux Gaussiennes
Le problème considéré dans cet article concerne l’optimisation des hyperparamètres d’une fonction noyau Gaussienne à l’aide de mesures de similitude entre matrices. Deux contributions sont proposées : 1) une nouvelle mesure de similarité entre fonctions noyaux et 2) une nouvelle paramétrisation pour les noyaux Gaussiens. Des améliorations des temps de calculs et des taux de bonnes classifications par rapport à la validation croisée pour un classifier k-nn sont obtenues sur des jeux de données standards
Kernel discriminant analysis and clustering with parsimonious Gaussian process models
This work presents a family of parsimonious Gaussian process models which
allow to build, from a finite sample, a model-based classifier in an infinite
dimensional space. The proposed parsimonious models are obtained by
constraining the eigen-decomposition of the Gaussian processes modeling each
class. This allows in particular to use non-linear mapping functions which
project the observations into infinite dimensional spaces. It is also
demonstrated that the building of the classifier can be directly done from the
observation space through a kernel function. The proposed classification method
is thus able to classify data of various types such as categorical data,
functional data or networks. Furthermore, it is possible to classify mixed data
by combining different kernels. The methodology is as well extended to the
unsupervised classification case. Experimental results on various data sets
demonstrate the effectiveness of the proposed method
Classification d’images hyperspectrales par des méthodes fonctionnelles non-paramétriques
la classification supervisée d’images hyperspectrales est rendue difficile par le grand nombre de variables spectrales et par le petit nombre d’échantillons de références pour l’entraînement. Plusieurs méthodes ont été proposées pour aborder ce problème. Citons par exemple les méthodes Bayésiennes, les méthodes d’extraction de caractéristiques, les forêts aléatoires, les réseaux de neurones ainsi que les méthodes à noyau. En particulier, les Machines à Vecteurs de Support ou Séparateur à Vaste Marge (SVM) ont montré de très bonnes performances en termes de bonnes classification. Cependant, une des caractéristiques principales de l’imagerie hyperspectrale n’a pas été encore étudiée : la très forte corrélation entre deux bandes spectrales consécutives, liée à la nature physique des spectres de réflectance. Une façon de prendre en compte cette propriété est de ne pas considérer les spectres comme des vecteurs de variables spectrales mais comme la discrétisation de fonctions continues de la longueur d’onde. Cette modélisation permet ainsi de prendre en compte naturellement l’ordre des bandes spectrales, la forme des spectres ou la dérivée des spectres de longueurs d’ondes. De plus, l’utilisation de mesures de proximité spécifiques appelées « pseudo-métriques » sur les fonctions permet une plus grande robustesse face à la grande dimension spectrale. Dans cette présentation, nous introduirons une approche non-paramétrique de classification de fonctions à l’aide d’un modèle statistique fonctionnel. En particulier, la construction de 3 pseudo-métriques adaptées à la comparaison de courbes sera présentée. La première pseudo-métrique considérée est une extension de la distance vectorielle L2 aux espaces fonctionnels, la seconde est basée sur l’Analyse Fonctionnelle en Composante Principale (FPCA) et la troisième utilise sur la Régression Multiples des Moindres Carrés Partiels (MPLSR). Des résultats obtenus sur des images hyperspectrales réelles seront présentés. Pour comparaison, un modèle de mélange Gaussien et des SVM ont été appliqués. En termes de taux d’erreurs de classification, la méthode proposée avec la pseudo-métrique MPLSR donnent les meilleurs résultats. Nous conclurons la présentation sur les perspectives qu’offre la modélisation fonctionnelle pour le traitement d’images hyperspectrales
Large-scale feature selection with Gaussian mixture models for the classification of high dimensional remote sensing images
A large-scale feature selection wrapper is discussed for the classification of high dimensional remote sensing. An efficient implementation is proposed based on intrinsic properties of Gaussian mixtures models and block matrix. The criterion function is split into two parts:one that is updated to test each feature and one that needs to be updated only once per feature selection. This split saved a lot of computation for each test. The algorithm is implemented in C++ and integrated into the Orfeo Toolbox. It has been compared to other classification algorithms on two high dimension remote sensing images. Results show that the approach provides good classification accuracies with low computation time
Object-based classification of grasslands from high resolution satellite image time series using gaussian mean map kernels
This paper deals with the classification of grasslands using high resolution satellite image time series. Grasslands considered in this work are semi-natural elements in fragmented landscapes, i.e., they are heterogeneous and small elements. The first contribution of this study is to account for grassland heterogeneity while working at the object level by modeling its pixels distributions by a Gaussian distribution. To measure the similarity between two grasslands, a new kernel is proposed as a second contribution: the a-Gaussian mean kernel. It allows one to weight the influence of the covariance matrix when comparing two Gaussian distributions. This kernel is introduced in support vector machines for the supervised classification of grasslands from southwest France. A dense intra-annual multispectral time series of the Formosat-2 satellite is used for the classification of grasslands’ management practices, while an inter-annual NDVI time series of Formosat-2 is used for old and young grasslands’ discrimination. Results are compared to other existing pixel- and object-based approaches in terms of classification accuracy and processing time. The proposed method is shown to be a good compromise between processing speed and classification accuracy. It can adapt to the classification constraints, and it encompasses several similarity measures known in the literature. It is appropriate for the classification of small and heterogeneous objects such as grasslands
Estimating taxonomic diversity and functional types of perennial forage grasses in mountain meadows: potentialities of Pléiades imagery
Estimating taxonomic diversity and functional types of perennial forage grasses in mountain meadows: potentialities of Pléiades imagery
Spectro-temporal heterogeneity measures from dense high spatial resolution satellite image time series: application to grassland species diversity estimation
Grasslands represent a significant source of biodiversity that is important to monitor over large extents. The Spectral Variation Hypothesis (SVH) assumes that the Spectral Heterogeneity(SH) measured from remote sensing data can be used as a proxy for species diversity. Here, we argue the hypothesis that the grassland’s species differ in their phenology and, hence, that the temporal variations can be used in addition to the spectral variations. The purpose of this study is to attempt verifying the SVH in grasslands using the temporal information provided by dense Satellite Image Time Series (SITS) with a high spatial resolution. Our method to assess the spectro-temporal heterogeneity is based on a clustering of grasslands using a robust technique for high dimensional data. We propose new SH measures derived from this clustering and computed at the grassland level. We compare them to the Mean Distance to Centroid (MDC). The method is experimented on 192 grasslands from southwest France using an intra-annual multispectral SPOT5 SITS comprising 18 images and using single images from this SITS. The combination of two of the proposed SH measures—the within-class variability and the entropy—in a multivariate linear model explained the variance of the grasslands’ Shannon index more than the MDC. However, there were no significant differences between the predicted values issued from the best models using multitemporal and monotemporal imagery. We conclude that multitemporal data at a spatial resolution of 10 m do not contribute to estimating the species diversity. The temporal variations may be more related to the effect of management practices
Prédiction des services écosystémiques dans les bois agricoles à partir d’images hyperspectrales
Les services écosystémiques sont devenus un enjeu social, écologique et économique majeur dans le monde. Les forêts des paysages agricoles offrent des services précieux bien qu'ils soient souvent sous-estimés et mal utilisés. Cependant, une cartographie précise de ces services à grande échelle reste difficile. Des données de télédétection permettent aujourd’hui d’envisager cette cartographie. Nous avons évalué la contribution des indices de végétation calculés à partir d'images hyperspectrales à haute résolution spatiale pour la prévision de services écosystémiques par rapport aux résultats fondées sur la couverture terrestre. 28 parcelles forestières ont été échantillonnées et des images hyperspectrales aéroportées ont été acquises pour la zone d'étude, à une résolution de 2 m. Habituellement, les indices de végétation dérivés de l'hyperspectral à l’échelle du paysage (buffer spatial autour de l’objet considéré) sont réduits en utilisant des statistiques descriptives (moyenne, écart-type, valeurs minimales et maximales). Cependant, cette approche peut perdre beaucoup d'informations, en particulier à l'échelle des paysages, où plusieurs objets avec différentes signatures spectrales sont présents. Nous proposons une description du paysage hyperspectral basée sur la répartition complète des indices de végétation à travers les paysages. Nous avons utilisé les modèles de mélange gaussien (GMM) pour modéliser la distribution des pixels dans chaque paysage et introduit une distance L2 entre ces mélanges. Cette distance est utilisée dans l’algorithme des plus proches voisins pour prédire les niveaux de services. La qualité des prédictions a été comparée entre trois représentations de paysage: occupation des sols, statistiques descriptives de données hyperspectrales et description de données hyperspectrales basées sur GMM
Spectral and spatial methods for the classification of urban remote sensing data
Lors de ces travaux, nous nous sommes intéressés au problème de la classification supervisée d'images satellitaires de
zones urbaines. Les données traitées sont des images optiques à très hautes résolutions spatiales: données panchromatiques à très haute résolution spatiale (IKONOS, QUICKBIRD, simulations PLEIADES) et des images hyperspectrales (DAIS, ROSIS).
Deux stratégies ont été proposées.
La première stratégie consiste en une phase d'extraction de caractéristiques spatiales et spectrales suivie d'une phase de classification. Ces caractéristiques sont extraites par filtrages morphologiques : ouvertures et fermetures géodésiques et filtrages surfaciques auto-complémentaires. La classification est réalisée avec les machines à vecteurs supports (SVM)
non linéaires. Nous proposons la définition d'un noyau spatio-spectral utilisant de manière conjointe l'information spatiale
et l'information spectrale extraites lors de la première phase.
La seconde stratégie consiste en une phase de fusion de données pre- ou post-classification. Lors de la fusion postclassification,
divers classifieurs sont appliqués, éventuellement sur plusieurs données issues d'une même scène (image panchromat
ique, image multi-spectrale). Pour chaque pixel, l'appartenance à chaque classe est estimée à l'aide des classifieurs. Un schéma de fusion adaptatif permettant d'utiliser l'information sur la fiabilité locale de chaque classifieur, mais aussi l'information globale disponible a priori sur les performances de chaque algorithme pour les différentes classes, est proposé.
Les différents résultats sont fusionnés à l'aide d'opérateurs flous.
Les méthodes ont été validées sur des images réelles. Des
améliorations significatives sont obtenues par rapport aux méthodes publiées dans la litterature
- …
