239 research outputs found

    CarottAge Windows pour les données Teruti : manuel d'utilisation

    Get PDF
    CarottAge est le résultat d'un travail de fouille de données effectué par des agronomes de l'Inra SAD ASTER (Mirecourt) et des informaticiens du projet Orpailleur Loria et Inria Grand Est pour extraire des bases de données agricoles Teruti des informations sur les successions de cultures pratiquées dans une région. CarottAge s'appuie sur la théorie des chaînes de Markov cachées - HMM comme Hidden Markov Model - pour permettre l'analyse de successions d'observations quelconques continues ou discrètes. Ce logiciel calcule et affiche un signal dont l'analyse permet l'extraction et la datation de régularités temporelles et spatiales. Il est fourni sous forme d'une boîte à outils comportant plusieurs programmes indépendants ainsi qu'une application graphique qui permet de les enchaîner d'une façon interactive

    Maîtriser la complexité des systèmes: apport de la fouille de données

    Get PDF
    Cet exposé présente les travaux du projet Orpailleur en matière de fouille de données en agriculture numériqueL'agriculture est une source importante de données numériques de différentes natures : données satellite, données issues de matériels connectés, données d'enquêtes. La fouille de ces données en vue d'extraire des connaissances doit résoudre des problèmes qui sont d'actualité en intelligence artificielle: classification de données temporelles et spatiales hétérogènes, visualisation de données agrégées, prise en compte de l'évolution temporelle dans un système d'information géographique. Cet exposé présenté au CAR (Comité d'Administration Régionale) pendant une table rondeprésente comment l'intelligence artificielle en fouille de données permet de diminuer la vulnérabilité de l'agriculture vis à vis des aléas climatiques et économiques.

    Modélisation stochastique et spectrale de l'occupation du sol

    Get PDF
    National audienceThis paper proposes a stochastic modeling of time series of items to mine periodic items into a stationary process. The representation of time series of items under the form of time series of tensors allows the use of digital signal processing methods like spectral analysis of auto cross correlation coefficients. We give promising results on synthetic data.Nous proposons une approche stochastique pour découvir des items périodiques dans un processus stationnaire. Le passage d'une représentation sous forme d'une série temporelle d'items à une représentation sous forme d'une série temporelle de tenseurs multi-dimensionnels nous permet d'utiliser les techniques de traitement de signaux multi-dimensionnels. A l'aide des coefficients d'auto corrélation croisés, nous montrons sur des données artificielles qu'une analyse spectrale permet de faire apparaître des comportements périodiques

    Aspects de la classification

    Get PDF
    Les techniques de classification numérique ont toujours été présentes en reconnaissance des formes. Les réseaux de neurones montrent chaque jour leurs (très ?) bonnes propriétés de classification, et la classification se fait de plus en plus présente en représentation des connaissances. Ainsi, ce rapport présente, simplement dans un but introductif, les aspects mathématiques, statistiques, neuromimétiques et cognitifs de la classification

    Issues in acoustic modeling of speech for automatic speech recognition

    Get PDF
    Projet RFIAStochastic modeling is a flexible method for handling the large variability in speech for recognition applications. In contrast to dynamic time warping where heuristic training methods for estimating word templates are used, stochastic modeling allows a probabilistic and automatic training for estimating models. This paper deals with the improvement of stochastic techniques, especially for a better representation of time varying phenomena

    Mother to Mother (M2M) peer support for women in prevention of mother to child transmission (PMTCT) programmes: a qualitative study

    Get PDF
    Introduction Mother-to-Mother (M2M) or “Mentor Mother” programmes utilise HIV positive mothers to provide support and advice to HIV positive pregnant women and mothers of HIV exposed babies. Médecins Sans Frontières (MSF) supported a Mentor Mother programme in Bulawayo, Zimbabwe from 2009 to 2012; with programme beneficiaries observed to have far higher retention at 6–8 weeks (99% vs 50%, p<0.0005) and to have higher adherence to Prevention of Mother to Child Transmission (PMTCT) guidelines, compared to those not opting in. In this study we explore how the M2M progamme may have contributed to these findings. Methods In this qualitative study we used thematic analysis of in-depth interviews (n = 79). This study was conducted in 2 urban districts of Bulawayo, Zimbabwe’s second largest city. Results Interviews were completed by 14 mentor mothers, 10 mentor mother family members, 30 beneficiaries (women enrolled both in PMTCT and M2M), 10 beneficiary family members, 5 women enrolled in PMTCT but who had declined to take part in the M2M programme and 10 health care staff members. All beneficiaries and health care staff reported that the programme had improved retention and provided rich information on how this was achieved. Additionally respondents described how the programme had helped bring about beneficial behaviour change. Conclusions M2M programmes offer great potential to empower communities affected by HIV to catalyse positive behaviour change. Our results illustrate how M2M involvement may increase retention in PMTCT programmes. Non-disclosure to one’s partner, as well as some cultural practices prevalent in Zimbabwe appear to be major barriers to participation in M2M programmes

    Simulation temporelle et spatiale des changements d'occupation du sol par modélisation stochastique

    Get PDF
    International audienceThe landscape patterns are the results of the human activity that adapts the land cover and its use (LUC) to constraints or economic opportunities encountered by various actors. The temporal and spatial arrangement of LUC has a strong influence on environmental risks. Its knowledge allows to develop prospective simulation models to assess the impact of different scenarios on the evolution of the land use and land cover change (LUCC). This paper presents a methodology based on stochastic models to identify, locate and simulate the temporal LUCC of regions differentiated by their successions by means of " neutral " models. The concept of a " neutral " model has been introduced in ecology for describing the characteristics of coexisting populations in a territory. Every individual-whatever its species it belongs to in the ecosystem-undergoes the same constraints without taking precedence over another. The result is a balance that is regulated by processes whose dynamics do not vary. In the framework of spatially explicit models coupled to a geographical information system according to the categorization defined by [AGG + 00], the territory is described as an assembly of homogeneous discontinuous units-called patches-represented by a regular grid of pixels. We propose a territorial simulation method that takes into account the dynamics of temporal and spatial patterns of previous successions observed in different sub-regions. We carry out a classification of the territory in homogeneous patches with respect to their LUC. The simulation of the LUC succession is then made on these patches at the pixel level taking into account the rotations / successions that were practiced the previous two years. The differences between simulated and observed data make it possible to detect breaks in the process of developing the territory according to the constraints or opportunities for farmers. Differences are measured using the pixel recognition rate on a rasterized representation of the territory. We assess our method on data that come from surveys in the Vittel-Contrex´eville territory (East of France) which is subject to water quality issues.L'organisation d'un territoire est le reflet de l'activité humaine qui y adapte la couverture du sol et son usage en fonction des contraintes ou opportunités économiques. L'arrangement temporel et spatial des occupations du sol a une forte influence sur les risques environnementaux. Sa connaissance permet d'élaborer des modèles de simulation prospective afin d'évaluer l'impact de différents scénarios d'évolution de la couverture du sol. Cet article présente une méthodologie à base de modèles stochastiques pour identifier, localiser et simuler les occupations temporelles des régions différenciées par leurs successions de culture dans la perspective de construction d'un modèle ``neutre''. Le concept de modèle ``neutre'' a été introduit en écologie pourdécrire les caractéristiques des populations coexistant dans un territoire. Les individus -- quelquesoit leur nature -- endurent les mêmes contraintes sans qu'une espèce ne prenne le pas sur une autre. Il en résulte un équilibre qui est régulé par des processus dont la dynamique ne varie pas. Nous nous plaçons dans un cadre de définition de modèles spatialement explicites couplés à un système d'information géographique selon la catégorisation définie par Agarwal {agarwal2000}. Le territoire est décrit comme un assemblage d'unités homogènes discontinues -- appelées patchs -- lesquelles sont constituées d'une grille régulière de pixels. sous la forme d'une image raster. Nous effectuons préalablement une classification du territoire d'étude en patchs homogènes vis à vis des successions de culture qui s'y pratiquent. La simulation de la succession est ensuite faite sur ces \patchs au niveau du pixel en tenant compte des rotations / successions qui se pratiquaient les deux années précédentes. Nous proposons ainsi une méthode de simulation du territoire qui tienne compte des dynamiques temporelles et spatiales des successions précédentes observées dans différentes sous régions. L'écart entre données simulées et observées permet de déceler des ruptures dans le processus de mise en valeur du territoire en fonction des contraintes ou opportunités s'offrant aux agriculteurs. Les écarts sont mesurés à l'aide du taux de reconnaissance de pixels sur une représentation rasterisée du territoire. Les données utilisées dans cette étude proviennent d'enquêtes effectuées sur le territoire de Vittel-Contrexéville concernant la qualité des eaux souterraines

    Analyse stochastique et spectrale de séries temporelles pour l'identification des occupations du sol

    Get PDF
    This application note shows the interest of the time series auto / cross covariance feature to mine periodic land use / land cover (LU/LC) in an agricultural landscape. A Bayesian point of view has been adopted to cope with the variability of the real-world data sets. The agricultural landscape is represented by a mosaic of plots, each of them holding a time series of annual LU/LC surveys. An agricultural district is seen as a sample drawn from a time series random process. For each LU, the autocovariance function of the random process is first calculated and its Fast Fourier Transform (FFT) performed. The peaks of the power spectrum determine the frequencies-or the corresponding periods-of this LU. In addition, the analysis of the crosscovariance between two LU/LC may exhibit the co-occurrences of these LU/LC at different lags and determine a return time. In the data mining of agricultural landscapes represented by a mosaic of agricultural plots, results on time series coming from annual LU/LC surveys are presented. They show that the auto / cross covariance coefficients and their spectral representation give immediate and accurate information to a data mining analyst on complex land use rotations and their trends for understanding the underlying logical process in landscape dynamics.Nous proposons une approche stochastique pour découvir des items périodiques dans un processus stationnaire. Le passage d’une représentation sous forme d’une série temporelle d’items à une représentation sous forme d’une série temporelle de tenseurs multi-dimensionnels nous permet d’utiliser les tech- niques de traitement de signaux multi-dimensionnels. A l’aide des coefficients d’auto corrélation croisés, nous montrons sur des données artificielles qu’une analyse spectrale permet de faire apparaître des comportements périodiques

    Learning to automatically detect features for mobile robots using second-order Hidden Markov Models

    Get PDF
    In this paper, we propose a new method based on Hidden Markov Models to interpret temporal sequences of sensor data from mobile robots to automaticall- y detect features. Hidden Markov Models have been used for a long time in pattern recognition, especially in speech recognition. Their main advantages over other methods (such as neural networks) are their ability to model noisy temporal signals of variable length. We show in this paper that this approach is well suited for interpretation of temporal sequences of mobile-robot sensor data. We present two distinct experiments and results: the first one in an indoor environment where a mobile robot learns to detect features like open doors or T-intersections, the second one in an outdoor environment where a different mobile robot has to identify situations like climbing a hill or crossing a rock

    Variable-Length Sequence Language Model for Large Vocabulary Continuous Dictation Machine

    Get PDF
    Colloque avec actes et comité de lecture.In natural language, some sequences of words are very frequent. A classical language model, like n-gram, does not adequately take into account such sequences, because it underestimates their probabilities. A better approach consists in modeling word sequences as if they were individual dictionary elements. Sequences are considered as additional entries of the word lexicon, on which language models are computed. In this paper, we present two methods for automatically determining frequent phrases in unlabeled corpora of written sentences. These methods are based on information theoretic criteria which insure a high statistical consistency. Our models reach their local optimum since they minimize the perplexity. One procedure is based only on the n-gram language model to extract word sequences. The second one is based on a class n-gram model trained on 233 classes extracted from the eight grammatical classes of French. Experimental tests, in terms of perplexity and recognition rate, are carried out on a vocabulary of 20000 words and a corpus of 43 million words extracted from the ?Le Monde? newspaper. Our models reduce perplexity by more than 20% compared with n-gram (nR3) and multigram models. In terms of recognition rate, our models outperform n-gram and multigram models
    • …
    corecore