9 research outputs found

    Consensus ou fusion de segmentation pour quelques applications de détection ou de classification en imagerie

    Full text link
    Récemment, des vraies mesures de distances, au sens d’un certain critère (et possédant de bonnes propriétés asymptotiques) ont été introduites entre des résultats de partitionnement (clustering) de donnés, quelquefois indexées spatialement comme le sont les images segmentées. À partir de ces métriques, le principe de segmentation moyenne (ou consensus) a été proposée en traitement d’images, comme étant la solution d’un problème d’optimisation et une façon simple et efficace d’améliorer le résultat final de segmentation ou de classification obtenues en moyennant (ou fusionnant) différentes segmentations de la même scène estimée grossièrement à partir de plusieurs algorithmes de segmentation simples (ou identiques mais utilisant différents paramètres internes). Ce principe qui peut se concevoir comme un débruitage de données d’abstraction élevée, s’est avéré récemment une alternative efficace et très parallélisable, comparativement aux méthodes utilisant des modèles de segmentation toujours plus complexes et plus coûteux en temps de calcul. Le principe de distance entre segmentations et de moyennage ou fusion de segmentations peut être exploité, directement ou facilement adapté, par tous les algorithmes ou les méthodes utilisées en imagerie numérique où les données peuvent en fait se substituer à des images segmentées. Cette thèse a pour but de démontrer cette assertion et de présenter différentes applications originales dans des domaines comme la visualisation et l’indexation dans les grandes bases d’images au sens du contenu segmenté de chaque image, et non plus au sens habituel de la couleur et de la texture, le traitement d’images pour améliorer sensiblement et facilement la performance des méthodes de détection du mouvement dans une séquence d’images ou finalement en analyse et classification d’images médicales avec une application permettant la détection automatique et la quantification de la maladie d’Alzheimer à partir d’images par résonance magnétique du cerveau.Recently, some true metrics in a criterion sense (with good asymptotic properties) were introduced between data partitions (or clusterings) even for data spatially ordered such as image segmentations. From these metrics, the notion of average clustering (or consensus segmentation) was then proposed in image processing as the solution of an optimization problem and a simple and effective way to improve the final result of segmentation or classification obtained by averaging (or fusing) different segmentations of the same scene which are roughly estimated from several simple segmentation models (or obtained with the same model but with different internal parameters). This principle, which can be conceived as a denoising of high abstraction data, has recently proved to be an effective and very parallelizable alternative, compared to methods using ever more complex and time-consuming segmentation models. The principle of distance between segmentations, and averaging of segmentations, in a criterion sense, can be exploited, directly or easily adapted, by all the algorithms or methods used in digital imaging where data can in fact be substituted to segmented images. This thesis proposal aims at demonstrating this assertion and to present different original applications in various fields in digital imagery such as the visualization and the indexation in the image databases, in the sense of the segmented contents of each image, and no longer in the common color and texture sense, or in image processing in order to sensibly and easily improve the detection of movement in the image sequence or finally in analysis and classification in medical imaging with an application allowing the automatic detection and quantification of Alzheimer’s disease

    Affirmation et transformations des sciences économiques en Suisse au XXe siècle

    Get PDF
    Cette thèse questionne l’affirmation et les transformations des sciences économiques (économie politique et gestion d’entreprise) en Suisse au XXe siècle. Nous utilisons une base de données biographiques sur cinq cohortes (1910, 1937, 1957, 1980, 2000) de professeurs d’université (N=561). Premièrement nous montrons que les sciences économiques s’affirment institutionnellement et disciplinairement dans l’académie. En particulier le capital académique (positions de recteurs) des professeurs de sciences économiques est le plus important parmi toutes les disciplines dans la période récente. Deuxièmement les professeurs de sciences économiques deviennent les professeurs les plus représentés parmi les élites économiques suisses (les grands patrons). Certains réalisent également des carrières parmi les élites politiques (les élus nationaux) et les élites administratives (les hauts fonctionnaires fédéraux). Nous observons une standardisation des carrières des professeurs entre deux types de profil : purement académique et partiellement extra-académique. Troisièmement nous montrons un processus de « nationalisation » des profils de professeurs après 1918 et de ré-internationalisation après 1945. Nous observons un déplacement d’une internationalité d’« excellence » scientifique des pays germanophones et francophones vers les USA. Finalement nous voyons que le capital scientifique (citations dans des revues prestigieuses) est lié au capital cosmopolite (internationalité) et opposé aux capitaux académique, économique et politique, plus nationaux. Quatrièmement cette opposition est confirmée par l’étude des interactions entre différents capitaux des professeurs. Nous identifions ainsi d’un côté un pôle scientifique et international et de l’autre un pôle « mondain », caractérisé par des capitaux nationaux, académiques, politiques et économiques. Le pôle scientifique utilise de plus en plus les mathématiques, et chacun des deux pôles a ses propres domaines de spécialisation. Nous observons que la dominance parmi les professeurs, outre l’usage de mathématiques et l’étude d’objets particuliers, se traduit également par une interdisciplinarité relativement soutenue, particulièrement avec les sciences « dures ». En conclusion nous affirmons que c’est par cette division du travail entre deux pôles de professeurs, ceux liés à la pratique scientifique et à l’excellence internationale, et ceux liés à l’administration des universités, des entreprises et de l’Etat, et par le renforcement historique de cette division, que les professeurs de sciences économiques sont « partout » et que la discipline a pu affirmer son pouvoir dans la société suisse

    Suivi écologique des prairies semi-naturelles : analyse statistique de séries temporelles denses d'images satellite à haute résolution spatiale

    Get PDF
    ID ProdINRA 415874Grasslands are a significant source of biodiversity in farmed landscapes that is important to monitor. New generation satellites such as Sentinel-2 offer new opportunities for grassland’s monitoring thanks to their combined high spatial and temporal resolutions. Conversely, the new type of data provided by these sensors involves big data and high dimensional issues because of the increasing number of pixels to process and the large number of spectro-temporal variables. This thesis explores the potential of the new generation satellites to monitor biodiversity and factors that influence biodiversity in semi-natural grasslands. Tools suitable for the statistical analysis of grasslands using dense satellite image time series (SITS) with high spatial resolution are provided. First, we show that the spectro-temporal response of grasslands is characterized by its variability within and among the grasslands. Then, for the statistical analysis, grasslands are modeled at the object level to be consistent with ecological models that represent grasslands at the field scale. We propose to model the distribution of pixels in a grassland by a Gaussian distribution. Following this modeling, similarity measures between two Gaussian distributions robust to the high dimension are developed for the classification of grasslands using dense SITS: the High-Dimensional Kullback-Leibler Divergence and the α-Gaussian Mean Kernel. The latter out-performs conventional methods used with Support Vector Machines for the classification of grasslands according to their management practices and to their age. Finally, indicators of grassland biodiversity issued from dense SITS are proposed through spectro-temporal heterogeneity measures derived from the unsupervised clustering of grasslands. Their correlation with the Shannon index is significant but low. The results suggest that the spectro-temporal variations measured from SITS at a spatial resolution of 10 meters covering the period when the practices occur are more related to the intensity of management practices than to the species diversity. Therefore, although the spatial and spectral properties of Sentinel-2 seem limited to assess the species diversity in grasslands directly, this satellite should make possible the continuous monitoring of factors influencing biodiversity in grasslands. In this thesis, we provided methods that account for the heterogeneity within grasslands and enable the use of all the spectral andtemporal information provided by new generation satellites.Les prairies représentent une source importante de biodiversité dans les paysages agricoles qu’il est important de surveiller. Les satellites de nouvelle génération tels que Sentinel-2 offrent de nouvelles opportunités pour le suivi des prairies grâce à leurs hautes résolutions spatiale et temporelle combinées. Cependant, le nouveau type de données fourni par ces satellites implique des problèmes liés au big data et à la grande dimension des données en raison du nombre croissant de pixels à traiter et du nombre élevé de variables spectro-temporelles. Cette thèse explore le potentiel des satellites de nouvelle génération pour le suivi de la biodiversité et des facteurs qui influencent la biodiversité dans les prairies semi-naturelles. Des outils adaptés à l’analyse statistique des prairies à partir de séries temporelles d’images satellites (STIS) denses à haute résolution spatiale sont proposés. Tout d’abord, nous montrons que la réponse spectro-temporelle des prairies est caractérisée par sa variabilité au sein des prairies et parmi les prairies. Puis, pour les analyses statistiques, les prairies sont modélisées à l’échelle de l’objet pour être cohérent avec les modèles écologiques qui représentent les prairies à l’échelle de la parcelle. Nous proposons de modéliser la distribution des pixels dans une prairie par une loi gaussienne. A partir de cette modélisation, des mesures de similarité entre deux lois gaussiennes robustes à la grande dimension sont développées pour la classification des prairies en utilisant des STIS denses: High-Dimensional Kullback-Leibler Divergence et α-Gaussian Mean Kernel. Cette dernière est plus performante que les méthodes conventionnelles utilisées avec les machines à vecteur de support (SVM) pour la classification du mode de gestion et de l’âge des prairies. Enfin, des indicateurs de biodiversité des prairies issus de STIS denses sont proposés à travers des mesures d’hétérogénéité spectro-temporelle dérivées du clustering non supervisé des prairies. Leur corrélation avec l’indice de Shannon est significative mais faible. Les résultats suggèrent que les variations spectro-temporelles mesurées à partir de STIS à 10 mètres de résolution spatiale et qui couvrent la période où ont lieu les pratiques agricoles sont plus liées à l’intensité des pratiques qu’à la diversité en espèces. Ainsi, bien que les propriétés spatiales et temporelles de Sentinel-2 semblent limitées pour estimer directement la diversité en espèces des prairies, ce satellite devrait permettre le suivi continu des facteurs influençant la biodiversité dans les prairies. Dans cette thèse, nous avons proposé des méthodes qui prennent en compte l’hétérogénéité au sein des prairies et qui permettent l’utilisation de toute l’information spectrale et temporelle fournie par les satellites de nouvelle génération

    Ecological monitoring of semi-natural grasslands : statistical analysis of dense satellite image time series with high spatial resolution

    Get PDF
    Grasslands are a significant source of biodiversity in farmed landscapes that is important to monitor. New generation satellites such as Sentinel-2 offer new opportunities for grassland’s monitoring thanks to their combined high spatial and temporal resolutions. Conversely, the new type of data provided by these sensors involves big data and high dimensional issues because of the increasing number of pixels to process and the large number of spectro-temporal variables. This thesis explores the potential of the new generation satellites to monitor biodiversity and factors that influence biodiversity in semi-natural grasslands. Tools suitable for the statistical analysis of grasslands using dense satellite image time series (SITS) with high spatial resolution are provided. First, we show that the spectro-temporal response of grasslands is characterized by its variability within and among the grasslands. Then, for the statistical analysis, grasslands are modeled at the object level to be consistent with ecological models that represent grasslands at the field scale. We propose to model the distribution of pixels in a grassland by a Gaussian distribution. Following this modeling, similarity measures between two Gaussian distributions robust to the high dimension are developed for the lassification of grasslands using dense SITS: the High-Dimensional Kullback-Leibler Divergence and the -Gaussian Mean Kernel. The latter outperforms conventional methods used with Support Vector Machines for the classification of grasslands according to their management practices and to their age. Finally, indicators of grassland biodiversity issued from dense SITS are proposed through spectro-temporal heterogeneity measures derived from the unsupervised clustering of grasslands. Their correlation with the Shannon index is significant but low. The results suggest that the spectro-temporal variations measured from SITS at a spatial resolution of 10 meters covering the period when the practices occur are more related to the intensity of management practices than to the species diversity. Therefore, although the spatial and spectral properties of Sentinel-2 seem limited to assess the species diversity in grasslands directly, this satellite should make possible the continuous monitoring of factors influencing biodiversity in grasslands. In this thesis, we provided methods that account for the heterogeneity within grasslands and enable the use of all the spectral and temporal information provided by new generation satellites

    Segmentation et classification dans les images de documents numérisés

    Get PDF
    Les travaux de cette thèse ont été effectués dans le cadre de l'analyse et du traitement d'images de documents imprimés afin d'automatiser la création de revues de presse. Les images en sortie du scanner sont traitées sans aucune information a priori ou intervention humaine. Ainsi, pour les caractériser, nous présentons un système d'analyse de documents composites couleur qui réalise une segmentation en zones colorimétriquement homogènes et qui adapte les algorithmes d'extraction de textes aux caractéristiques locales de chaque zone. Les informations colorimétriques et textuelles fournies par ce système alimentent une méthode de segmentation physique des pages de presse numérisée. Les blocs issus de cette décomposition font l'objet d'une classification permettant, entre autres, de détecter les zones publicitaires. Dans la continuité et l'expansion des travaux de classification effectués dans la première partie, nous présentons un nouveau moteur de classification et de classement générique, rapide et facile à utiliser. Cette approche se distingue de la grande majorité des méthodes existantes qui reposent sur des connaissances a priori sur les données et dépendent de paramètres abstraits et difficiles à déterminer par l'utilisateur. De la caractérisation colorimétrique au suivi des articles en passant par la détection des publicités, l'ensemble des approches présentées ont été combinées afin de mettre au point une application permettant la classification des documents de presse numérisée par le contenu.In this thesis, we deal with printed document images processing and analysis to automate the press reviews. The scanner output images are processed without any prior knowledge nor human intervention. Thus, to characterize them, we present a scalable analysis system for complex documents. This characterization is based on a hybrid color segmentation suited to noisy document images. The color analysis customizes text extraction algorithms to fit the local image properties. The provided color and text information is used to perform layout segmentation in press images and to compute features on the resulting blocks. These elements are classified to detect advertisements. In the second part of this thesis, we deal with a more general purpose: clusternig and classification. We present a new clustering approach, named ACPP, which is completely automated, fast and easy to use. This approach's main features are its independence of prior knowledge about the data and theoretical parameters that should be determined by the user. Color analysis, layout segmentation and the ACPP classification method are combined to create a complete processing chain for press images.VILLEURBANNE-DOC'INSA LYON (692662301) / SudocVILLEURBANNE-DOC'INSA-Bib. elec. (692669901) / SudocSudocFranceF

    Caractérisation des propriétés chimiques du bois des Peupliers Hybrides et développement des modèles de leur prédiction par Infra-rouge proche

    Get PDF
    Grâce à sa remarquable productivité, le peuplier hybride présente un intérêt pour l’industrie forestière. Ses meilleurs clones ont des caractéristiques du bois similaires, voire supérieures, à celles du peuplier faux-tremble. Ils possèdent un grand potentiel d’utilisation pour différentes applications dont les pâtes et papiers, les panneaux de bois et la bioénergie. Cependant, peu d’information est disponible sur les propriétés chimiques de leur bois. Ces dernières déterminent leur potentiel d’utilisation pour diverses applications, dont les bioproduits et la bioénergie. Les méthodes de caractérisation conventionnelles des propriétés chimiques sont destructives et très coûteuses. L’utilisation de la spectroscopie infrarouge permet de caractériser la chimie de surface des fibres de bois sans les quantifier. Par contre, l’infrarouge proche permet de quantifier la composition chimique du bois en utilisant des modèles de prédiction spécifiques à chaque essence de bois. Ainsi, l’objectif général de ce travail de recherche est de caractériser et de quantifier les propriétés chimiques du bois de différents clones de peuplier hybride par spectroscopie infrarouge proche. Les objectifs spécifiques sont : 1) Évaluer les proportions de l’aubier et du duramen du bois des différents clones de peuplier hybride; 2) Évaluer la densité basale et les proportions des composants chimiques du bois de l’aubier et du duramen de ces clones; 3) Analyser la chimie de surface du bois de ces clones par spectroscopie infrarouge proche; 4) développer des modèles de prédiction des propriétés chimiques du bois des peupliers hybrides à partir des résultats de spectroscopie infrarouge proche. Les teneurs en lignine, cellulose, hémicelluloses et en extractibles sont déterminés selon les normes en vigueur. Les données de la spectroscopie infrarouge proche combinées aux données de référence ont permis de développer des modèles prédictifs de la composition chimique du bois des peupliers hybrides

    Les approches chaos-stochastiques du risque de marché

    Get PDF
    The complexity of financial markets and the resurgence of severe crises contribute to the skepticism and evolution of standard econometric models in the explanation and prediction of financial time series. The warning given jointly by prudential authorities and researchers aims to encourage the development of nonlinear and more complex models inspired by other disciplines. I argue in this thesis that a chaos-stochastic approach of financial dynamics is likely to lead to better results. The relevance of this association is evaluated for market risk in two distinct analytical frameworks. I show the improvements given by a synthesis of chaotic models and GARCH specifications with or without Markov Regime Switching (MRS) for modelling and predicting the Value-at-Risk of 7 mains index of Monetary and Economic Union. It appears, from this study, better results from chaos-stochastic models. In the case of the MRS-GARCH specifications, I find more adequacy of the chaotic model of Lasota (1977) for the indices of Southern Europe, which are especially more volatile than those of Northern Europe for which I recommend the model of Mackey-Glass (1977). This combination allows, in a bivariate framework, to provide information on the relationship between these different indices. I introduce two new specifications that integrate issues related to correlation breakdowns. The first distinguishes, by a sub-periods analysis, the relations of interdependence of contagious relationships. Meanwhile, the second provides, in a unified framework, an integration of correlations breakdowns. These two analyses imply It appears from this double analysis the leading role of the Franco-German duo, the existence of two distinct spheres formed in a part by the Northern European indices and in another part by countries of the Southern Europe, and the intensification of relations between some indices following the sovereign debt crisis. Finally, these results support the relevance of a chaotic model which may account for some volatilities that are, wrongly, attributed to GARCH effects.La complexité des marchés financiers et la recrudescence des crises particulièrement sévères contribuent à l'évolution et à la remise en cause de modèles économétriques dits standards dans l'explication et la prévision des dynamiques financières. L'alerte donnée conjointement par les responsables prudentiels et les chercheurs vise à encourager le développement de modèles plus complexes, non linéaires et largement inspirés d'autres disciplines. Nous soutenons dans cette thèse l'idée qu'une approche chaos-stochastique des chroniques financières est susceptible de conduire à de meilleurs résultats. La pertinence de cette association est évaluée pour le risque de marché dans deux cadres d'analyse distincts. Nous montrons tout l'intérêt d'une synthèse des modèles chaotiques et des spécifications GARCH avec ou sans changements de régimes markoviens (MRS) pour la modélisation et la prévision de la Value-at-Risk des indices boursiers de la zone euro. Il ressort de cette étude de meilleurs résultats des modèles chaos-stochastiques et dans le cas des spécifications MRS-GARCH, une meilleure adéquation du modèle chaotique de Lasota(1977) pour les indices de l'Europe du Sud, particulièrement plus volatiles que ceux de l'Europe du Nord pour lesquels nous recommandons le modèle de Mackey-Glass(1977). Cette combinaison permet, dans un cadre bivarié, de mieux appréhender les liens qui existent entre les différentes places boursières de la zone euro. Nous introduisons deux nouvelles spécifications qui intègrent les problématiques liées aux ruptures de corrélations : la première permet de distinguer, par une analyse en sous-périodes, les relations d'interdépendance par rapport aux phénomènes de contagion et la seconde propose, dans un cadre unifié, d'intégrer les ruptures de corrélations. Cette double analyse met en évidence le rôle moteur du couple d'indices franco-allemand, l'existence de deux sphères distinctes constituées d'une part par les indices de l'Europe du Nord et d'autre part par les pays de l'Europe du Sud et l'intensification de certaines relations entre indices suite à la crise des dettes souveraines. Nous constatons et insistons sur la pertinence d'un modèle chaotique en moyenne pour rendre compte d'une part de la volatilité attribuée, à tort, aux effets GARCH

    Clustering en haute dimension par accumulation de clusterings locaux

    No full text
    National audienceLe clustering est une tâche fondamentale de la fouille de données. Ces dernières années, les méthodes de type cluster ensembles ont été l'objet d'une attention soutenue. Il s'agit d'agréger plusieurs clusterings d'un jeu de données afin d'obtenir un clustering "moyen". Les clusterings individuels peuvent être le résultat de différents algorithmes. Ces méthodes sont particulièrement utiles lorsque la dimensionalité des données ne permet pas aux méthodes classiques basées sur la distance et/ou la densité de fonctionner correctement. Dans cet article, nous proposons une méthode pour obtenir des clusterings individuels à faible coût, à partir de projections partielles du jeu de données. Nous évaluons empiriquement notre méthode et la comparons à trois méthodes de différents types. Nous constatons qu'elle donne des résultats sensiblement supérieurs aux autres
    corecore