68 research outputs found

    Towards the Automated Extraction of Flexibilities from Electricity Time Series

    Get PDF

    Recherche de motifs et cartographie des surfaces agricoles. Des relevés terrain aux données satellitaires : application au Mali

    Get PDF
    International audienceLa cartographie automatique de territoires ruraux est un outil essentiel dans le contexte sociétal actuel (e.g., analyse des risques de famine, étude des risques liés à la déforestation). Dans cet article, nous présentons une approche préliminaire de caractérisation des paysages ruraux et de leurs systèmes de culture à partir de techniques de fouille de données (recherche d'itemsets fréquents). Cette méthode permet de coupler des données de relevés terrain aux indicateurs extraits des images satellitaires. Cette approche a été mise en ½uvre sur des données associées au Mali en collaboration avec des experts du domaine posant les premières bases d'une méthode originale d'extraction de motifs à partir de données complexes. / Countryside automatic cartography is a real and decisive challenge in the current societal context (e.g., the famine risk analysis, the deforestation consequence analysis). In this paper, we propose a preliminary approach allowing the landscape characterization. More precisely, an itemset-based-technique is developed to extract crop types features. One of the main strengths of the proposed methodology is to combine both indicators extracted from satellite image and data collected from a site survey. The approach was run on data associated to Mali in collaboration with some domain experts

    Spatio-Temporal Ensemble Prediction on Mobile Broadband Network Data

    Get PDF

    Une structure basée sur les hiérarchies pour synthétiser les itemsets fréquents extraits dans des fenêtres temporelles

    Get PDF
    National audienceLe paradigme des flots de données rend impossible la conservation de l'inté- gralité de l'historique d'un flot qu'il faut alors résumer. L'extraction d'itemsets fréquents sur des fenêtres temporelles semble tout à fait adaptée mais l'amoncellement des résultats indépendants rend impossible l'exploitation de ces résultats. Nous proposons une struc- ture basée sur les hiérarchies des données afin d'unifiant ces résultats. De plus, puisque la plupart des données d'un flot présentent un caractère multidimensionnel, nous intégrons la prise en compte d'itemsets multidimensionnels. Enfin, nous pallions une faiblesse ma- jeure des Tilted Time Windows (TTW) en prenant en compte la distribution des données

    TIGER : Interrogation d'une table relationnelle par extension de critères

    Get PDF
    National audienceAujourd'hui, le web offre une sorte de place publique o` u les sites marchands prolifèrent. Dans un contexte extrêmement concurrentiel, il est capital pour un site de retenir un utilisateur lorsqu'il effectue une recherche. Parmi les stratégies possibles pour atteindre cet objectif, offriràoffrir`offrirà l'utilisateur un outil de recherche flexible est un axe intéressantintéressantàintéressantàétudier. A l'heure actuelle, les formulaires présents sur les sites marchands interprètent demanì ere stricte les critères saisis. Proposer une gestion plus flexible de ces critères permettrait de diminuer le nombre de requêtes formulées et améliorerait donc la qualité de la recherche. Nous proposons, TIGER,une méthode pour une prise en compte flexible des critères utilisateurs. Ainsi, si les critères sont trop contraignants, nous proposons ` a l'utilisateur une combinaison d'extensions de ses critères qui maximise la qualité du résultat tout en minimisant la distancè a la requête d'origine. Les expérimentations menées permettent de valider la qualité des résultats obtenus

    Spatio-temporal data classification through multidimensional sequential patterns: Application to crop mapping in complex landscape

    Get PDF
    International audienceThe main use of satellite imagery concerns the process of the spectral and spatial dimensions of the data. However, to extract useful information, the temporal dimension also has to be accounted for which increases the complexity of the problem. For this reason, there is a need for suitable data mining techniques for this source of data. In this work, we developed a data mining methodology to extract multidimensional sequential patterns to characterize temporal behaviors. We then used the extracted multidimensional sequences to build a classifier, and show how the patterns help to distinguish between the classes. We evaluated our technique using a real-world dataset containing information about land use in Mali (West Africa) to automatically recognize if an area is cultivated or not

    Datastream Summarization : patterns, Data Cubes and Hierarchies

    No full text
    L'explosion du volume de données disponibles due au développement des technologies de l'information et de la communication a démocratisé les flots qui peuvent être définis comme des séquences non bornées de données très précises et circulant à grande vitesse. Les stocker intégralement est par définition impossible. Il est alors essentiel de proposer des techniques de résumé permettant une analyse a posteriori de cet historique. En outre, un grand nombre de flots de données présentent un caractère multidimensionnel et multiniveaux que très peu d'approches existantes exploitent. Ainsi, l'objectif de ces travaux est de proposer des méthodes de résumé exploitant ces spécificités multidimensionnelles et applicables dans un contexte dynamique. Nous nous intéressons à l'adaptation des techniques OLAP (On Line Analytical Processing ) et plus particulièrement, à l'exploitation des hiérarchies de données pour réaliser cette tâche. Pour aborder cette problématique, nous avons mis en place trois angles d'attaque. Tout d'abord, après avoir discuté et mis en évidence le manque de solutions satisfaisantes, nous proposons deux approches permettant de construire un cube de données alimenté par un flot. Le deuxième angle d'attaque concerne le couplage des approches d'extractions de motifs fréquents (itemsets et séquences) et l'utilisation des hiérarchies pour produire un résumé conservant les tendances d'un flot. Enfin, les catégories de hiérarchies existantes ne permettent pas d'exploiter les connaissances expertes dans le processus de généralisation. Nous pallions ce manque en définissant une nouvelle catégorie de hiérarchies, dites contextuelles, et en proposant une modélisation conceptuelle, graphique et logique d'un entrepôt de données intégrant ces hiérarchies contextuelles. Cette thèse s'inscrivant dans un projet ANR (MIDAS), une plateforme de démonstration intégrant les principales approches de résumé a été mise au point. En outre, la présence de partenaires industriels tels que Orange Labs ou EDF RD dans le projet a permis de confronter nos approches à des jeux de données réelles.Due to the rapid increase of information and communication technologies, the amount of generated and available data exploded and a new kind of data, the stream data, appeared. One possible and common definition of data stream is an unbounded sequence of very precise data incoming at an high rate. Thus, it is impossible to store such a stream to perform a posteriori analysis. Moreover, more and more data streams concern multidimensional and multilevel data and very few approaches tackle these specificities. Thus, in this work, we proposed some practical and efficient solutions to deal with such particular data in a dynamic context. More specifically, we were interested in adapting OLAP (On Line Analytical Processing ) and hierarchy techniques to build relevant summaries of the data. First, after describing and discussing existent similar approaches, we have proposed two solutions to build more efficiently data cube on stream data. Second, we were interested in combining frequent patterns and the use of hierarchies to build a summary based on the main trends of the stream. Third, even if it exists a lot of types of hierarchies in the literature, none of them integrates the expert knowledge during the generalization phase. However, such an integration could be very relevant to build semantically richer summaries. We tackled this issue and have proposed a new type of hierarchies, namely the contextual hierarchies. We provide with this new type of hierarchies a new conceptual, graphical and logical data warehouse model, namely the contextual data warehouse. Finally, since this work was founded by the ANR through the MIDAS project and thus, we had evaluated our approaches on real datasets provided by the industrial partners of this project (e.g., Orange Labs or EDF R&D)

    Datastream Summarization : patterns, Data Cubes and Hierarchies

    No full text
    L'explosion du volume de données disponibles due au développement des technologies de l'information et de la communication a démocratisé les flots qui peuvent être définis comme des séquences non bornées de données très précises et circulant à grande vitesse. Les stocker intégralement est par définition impossible. Il est alors essentiel de proposer des techniques de résumé permettant une analyse a posteriori de cet historique. En outre, un grand nombre de flots de données présentent un caractère multidimensionnel et multiniveaux que très peu d'approches existantes exploitent. Ainsi, l'objectif de ces travaux est de proposer des méthodes de résumé exploitant ces spécificités multidimensionnelles et applicables dans un contexte dynamique. Nous nous intéressons à l'adaptation des techniques OLAP (On Line Analytical Processing ) et plus particulièrement, à l'exploitation des hiérarchies de données pour réaliser cette tâche. Pour aborder cette problématique, nous avons mis en place trois angles d'attaque. Tout d'abord, après avoir discuté et mis en évidence le manque de solutions satisfaisantes, nous proposons deux approches permettant de construire un cube de données alimenté par un flot. Le deuxième angle d'attaque concerne le couplage des approches d'extractions de motifs fréquents (itemsets et séquences) et l'utilisation des hiérarchies pour produire un résumé conservant les tendances d'un flot. Enfin, les catégories de hiérarchies existantes ne permettent pas d'exploiter les connaissances expertes dans le processus de généralisation. Nous pallions ce manque en définissant une nouvelle catégorie de hiérarchies, dites contextuelles, et en proposant une modélisation conceptuelle, graphique et logique d'un entrepôt de données intégrant ces hiérarchies contextuelles. Cette thèse s'inscrivant dans un projet ANR (MIDAS), une plateforme de démonstration intégrant les principales approches de résumé a été mise au point. En outre, la présence de partenaires industriels tels que Orange Labs ou EDF RD dans le projet a permis de confronter nos approches à des jeux de données réelles.Due to the rapid increase of information and communication technologies, the amount of generated and available data exploded and a new kind of data, the stream data, appeared. One possible and common definition of data stream is an unbounded sequence of very precise data incoming at an high rate. Thus, it is impossible to store such a stream to perform a posteriori analysis. Moreover, more and more data streams concern multidimensional and multilevel data and very few approaches tackle these specificities. Thus, in this work, we proposed some practical and efficient solutions to deal with such particular data in a dynamic context. More specifically, we were interested in adapting OLAP (On Line Analytical Processing ) and hierarchy techniques to build relevant summaries of the data. First, after describing and discussing existent similar approaches, we have proposed two solutions to build more efficiently data cube on stream data. Second, we were interested in combining frequent patterns and the use of hierarchies to build a summary based on the main trends of the stream. Third, even if it exists a lot of types of hierarchies in the literature, none of them integrates the expert knowledge during the generalization phase. However, such an integration could be very relevant to build semantically richer summaries. We tackled this issue and have proposed a new type of hierarchies, namely the contextual hierarchies. We provide with this new type of hierarchies a new conceptual, graphical and logical data warehouse model, namely the contextual data warehouse. Finally, since this work was founded by the ANR through the MIDAS project and thus, we had evaluated our approaches on real datasets provided by the industrial partners of this project (e.g., Orange Labs or EDF R&D)
    corecore