282 research outputs found

    Intégration et optimisation des grilles régulières de points dans une architecture SOLAP relationnelle

    Get PDF
    IRSTEA : PUB00043913Continuous fields are types of spatial representations used to model phenomena such as temperature, pollution or altitude. They are defined according to a mapping function f that assigns a value of the studied phenomenon to each p location of the studied area. Moreover, the representation of continuous fields at different scales or resolutions is often essential for effective spatial analysis. The advantage of continuous fields is the level of details generated by the continuity of the spatial data, and the quality of the spatial analysis provided by the multi-resolution. The downside of this type of spatial representations in the multidimensionnal analysis is the high cost of analysis and storage performances. Moreover, spatial data warehouses and spatial OLAP systems (EDS and SOLAP) are decision support systems that enable multidimensional spatial analysis of large volumes of spatial and non-spatial data. The analysis of continuous fields in SOLAP architecture represents an interesting research challenge. Various studies have focused on the integration of such representations in SOLAP system. However, this integration still at an early stage. Thus, this thesis focuses on the integration of incomplete continuous fields represented by a regular grid of points in the spatio-multidimensional analysis. This integration in the SOLAP system involves that the analysis of continuous fields must support:(i) conventional OLAP operators, (ii) Continuous spatial data, (iii) spatial operators (spatial slice), and (iv) querying data at different predefined levels of resolutions. In this thesis we propose differents approaches for the analysis of continuous fields in SOLAP system at different levels of the relational architecture (from the conceptual modeling to the optimization of computing performance). We propose a logical model FISS to optimize the performances of the multi-resolution analysis, based on interpolation methods. Then, we present a new methodology based on the Clustering sampling method, to optimize aggregation operations on regular grids of points in the relational SOLAP architecture.Les champs continus sont des types de représentations spatiales utilisées pour modéliser des phénomènes tels que la température, la pollution ou l’altitude. Ils sont définis selon une fonction de mapping f qui affecte une valeur du phénomène étudié à chaque localisation p du domaine d’étude. Par ailleurs, la représentation des champs continus à différentes échelles ou résolutions est souvent essentielle pour une analyse spatiale efficace. L’avantage des champs continus réside dans le niveau de détails généré par la continuité, ainsi que la qualité de l’analyse spatiale fournie par la multi-résolution. L’inconvénient de ce type de représentations dans l’analyse spatio-multidimensionnelle est le coût des performances d’analyse et de stockage. Par ailleurs, les entrepôts de données spatiaux et les systèmes OLAP spatiaux (EDS et SOLAP) sont des systèmes d’aide à la décision qui permettent l’analyse spatio-multidimensionnelle de grands volumes de données spatiales et non spatiales. L’analyse des champs continus dans l’architecture SOLAP représente un défi de recherche intéressant. Différents travaux se sont intéressés à l’intégration de ce type de représentations dans le système SOLAP. Cependant, celle-ci est toujours au stade embryonnaire. Cette thèse s’intéresse à l’intégration des champs continus incomplets représentés par une grille régulière de points dans l’analyse spatio-multidimensionnelle. Cette intégration dans le système SOLAP implique que l’analyse des champs continus doit supporter : (i) les opérateurs OLAP classiques, (ii) la vue continue des données spatiales, (iii) les opérateurs spatiaux (slice spatial) et (iv) l’interrogation des données à différentes résolutions prédéfinies. Dans cette thèse nous proposons différentes approches pour l’analyse des champs continus dans le SOLAP à différents niveaux de l’architecture relationnelle, de la modélisation conceptuelle à l’optimisation des performances de calcul. Nous proposons un modèle logique FISS qui permet d’optimiser les performances d’analyse à multi-résolution en se basant sur des méthodes d’interpolation. Puis, nous exposons une méthodologie basée sur la méthode d’échantillonnage du Clustering, qui permet d’optimiser les opérations d’agrégation des grilles régulières de points dans l’architecture SOLAP relationnelle en effectuant une estimation des résultats

    Analyse en ligne (OLAP) de documents

    Get PDF
    Thèse également disponible sur le site de l'Université Paul Sabatier, Toulouse 3 : http://thesesups.ups-tlse.fr/160/Data warehouses and OLAP systems (On-Line Analytical Processing) provide methods and tools for enterprise information system data analysis. But only 20% of the data of a corporate information system may be processed with actual OLAP systems. The rest, namely 80%, i.e. documents, remains out of reach of OLAP systems due to the lack of adapted tools and processes. To solve this issue we propose a multidimensional conceptual model for representing analysis concepts. The model rests on a unique concept that models both analysis subjects as well as analysis axes. We define an aggregation function to aggregate textual data in order to obtain a summarised vision of the information extracted from documents. This function summarises a set of keywords into a smaller and more general set. We introduce a core of manipulation operators that allow the specification of analyses and their manipulation with the use of the concepts of the model. We associate a design process for the integration of data extracted from documents within an OLAP system that describes the phases for designing the conceptual schema, for analysing the document sources and for the loading process. In order to validate these propositions we have implemented a prototype.Les entrepôts de données et les systèmes d'analyse en ligne OLAP (On-Line Analytical Processing) fournissent des méthodes et des outils permettant l'analyse de données issues des systèmes d'information des entreprises. Mais, seules 20% des données d'un système d'information est constitué de données analysables par les systèmes OLAP actuels. Les 80% restant, constitués de documents, restent hors de portée de ces systèmes faute d'outils ou de méthodes adaptés. Pour répondre à cette problématique nous proposons un modèle conceptuel multidimensionnel pour représenter les concepts d'analyse. Ce modèle repose sur un unique concept, modélisant à la fois les sujets et les axes d'une analyse. Nous y associons une fonction pour agréger des données textuelles afin d'obtenir une vision synthétique des informations issues de documents. Cette fonction résume un ensemble de mots-clefs par un ensemble plus petit et plus général. Nous introduisons un noyau d'opérations élémentaires permettant la spécification d'analyses multidimensionnelles à partir des concepts du modèle ainsi que leur manipulation pour affiner une analyse. Nous proposons également une démarche pour l'intégration des données issues de documents, qui décrit les phases pour concevoir le schéma conceptuel multidimensionnel, l'analyse des sources de données ainsi que le processus d'alimentation. Enfin, pour valider notre proposition, nous présentons un prototype

    Analyse organisationnelle de la collaboration décideurs/chercheurs en soutien à la réforme du système de santé dans la région de Québec

    Get PDF
    La constitution d'une collaboration formelle entre décideurs/planificateurs et chercheurs universitaires a été mise en oeuvre pour soutenir les transformations des organisations des services du système de santé dans la région de Québec. Les piliers de cette alliance étaient la création et la mise en place d'un Groupe-conseil sur les transformations ainsi que l'élaboration d'un plan du monitorage des transformations sous la conduite de ce Groupe-conseil. Cependant, le plan du monitorage n'a pas été accepté par les membres du Comité Directeurs du Plan régional d'organisation des services de santé et services sociaux intégrés de la Région, l'instance ultime qui avait à accepter le plan avant son implantation. La non-adoption du plan de monitorage représente donc un non-succès d'une démarche inspirée par les connaissances sur les stratégies de changement. La présente étude vise à mieux comprendre les facteurs organisationnels associés à l'évolution de l'alliance décideurs/planificateurs-chercheurs universitaires, et son impact sur le soutien des chercheurs aux transformations du système de santé dans la région de Québec. L'analyse de cette étude a eu recourt à deux approches conceptuelles : les coalitions de Gamson (1961) pour l'analyse des rapports entre acteurs concernés, et les archétypes de Hinings et Greenwood (1988) pour l'analyse des facteurs organisationnels qui sous-tendent ces rapports. Une méthode qualitative a été privilégiée. Huit entrevues individuelles ont été réalisées, en face à face, avec des planificateurs ou cadres supérieurs, ainsi que des chercheurs universitaires (et un non universitaire). Les principaux constats révèlent l'existence d'un réel intérêt à développer un rapprochement entre décideurs/planificateurs et chercheurs universitaires dans la région. Les entrevues révèlent également les éléments clefs associés au non-succès de la collaboration formelle décideurs-chercheurs en soutien aux transformations du système de santé dans la région de Québec

    Analyse d'images : Filtrage et segmentation

    Get PDF
    Ouvrage publié avec l'aide du Ministère des affaires étrangères, direction de la coopération scientifique et technique. AVERTISSEMENT Le livre publié en 1995 chez MASSON (EAN13 : 9782225849237) est épuisé. Cette version pdf est une version élaborée à partie de la version préliminaire transmise à l'éditeur. La mise en page est légèrement différente de celle du livre. Malheureusement quelques figures de l'annexe C ont été perdues.International audienceL'analyse d'image touche à l'heure actuelle de nombreux domaines, avec des objectifs aussi variés que l'aide au diagnostic pour les images médicales, la vision artificielle en robotique ou l'analyse des ressources terrestres à partir des images prises par satellite. Le but du traitement de ces images est à la fois simple dans son concept et difficile dans sa réalisation. Simple en effet, puisqu'il s'agit de reconnaître des objets que notre système visuel perçoit rapidement, du moins pour la majorité d'entre eux. Difficile cependant, car dans la grande quantité d'informations contenues dans l'image, il faut extraire des éléments pertinents pour l'application visée et ceci indépendamment de la qualité de l'image. L'analyse d'image s'est donc dotée d'outils et de méthodes puissants issus de domaines aussi variés que les mathématiques, le traitement du signal, ou l'informatique. Cet ouvrage présente un des aspects les plus importants du traitement des images : la " segmentation ". Il récapitule d'abord les grandeurs observables et calculables sur une image et les algorithmes de manipulation des structures de données associées. Il détaille ensuite les traitements préliminaires, tels le filtrage du bruit et les deux types d'approche de la segmentation, l'extraction des contours et celle des régions. Chacune fait l'objet d'une étude théorique et de nombreux résultats illustrent les performances. Une des originalités de l'ouvrage est l'étude comparative des différentes techniques appliquées sur un même corpus d'images réelles

    Apprentissage par renforcement Bayésien de processus décisionnels de Markov partiellement observables : une approche basée sur les processus Gaussiens

    Get PDF
    L'apprentissage par renforcement est une approche d'apprentissage automatique permettant de développer des systèmes s'améliorant à partir d'interactions avec un environnement. Les processus décisionnels de Markov partiellement observables (PDMPO) font partie des modèles mathématiques fréquemment utiliser pour résoudre ce type de problème d'apprentissage. Cependant, la majorité des méthodes de résolution utilisées dans les processus décisionnels de Markov partiellement observables nécessitent la connaissance du modèle. De plus, les recherches actuelles sur le PDMPO se restreignent principalement aux espaces d'états discrets, ce qui complique son application à certains problèmes naturellement modélisés par un espace d'état continu. Ce mémoire présente une vision des PDMPO basée sur les processus Gaussiens, une méthode d'apprentissage supervisée ayant comme propriété particulière d'être une distribution de probabilité dans l'espace des fonctions. Cette propriété est notamment très intéressante du fait qu'elle ouvre la porte à un traitement Bayésien de l'incertitude sur les fonctions inconnues d'un PDMPO continu. Les résultats obtenus avec l'approche d'apprentissage par processus Gaussien montrent qu'il est possible d'opérer dans un environnement tout en identifiant le modèle de ce celui-ci. À partir des conclusions tirées à la suite de nos travaux sur le PDMPO, nous avons observé un certain manque pour ce qui est de l'identification du modèle sous l'incertain. Ainsi, ce mémoire expose aussi un premier pas vers une extension de l'apprentissage de PDMPO continu utilisant des séquences d'états de croyances lors de l'identification du modèle. Plus précisément, nous proposons une méthode de régression par processus Gaussiens utilisant des ensembles d'entraînement incertain pour réaliser l'inférence dans l'espace des fonctions. La méthode proposée est particulièrement intéressante, du fait qu'elle s'applique exactement comme pour le cas des processus Gaussiens classiques et qu'elle n'augmente p±as la complexité de l'apprentissage

    Étude comparative des algorithmes dédiés à la classification

    Get PDF

    Développement d’une méthode d’automate cellulaire basé sur une tessellation irrégulière et hiérarchique pour la simulation des processus spatiotemporels

    Get PDF
    Les systèmes d’information géographique (SIG) sont largement utilisés pour représenter, gérer et analyser les données spatiales dans plusieurs disciplines incluant les géosciences, l’agriculture, la foresterie, la météorologie et l’océanographie. Néanmoins, malgré l’avancement récent des technologies des SIG, ils sont encore limités dans la représentation et la simulation des processus spatiotemporels. Ce travail de recherche définit le cadre théorique, conceptuel et applicatif qui vise à améliorer les méthodes de compréhension, de représentation et de simulation des processus dynamiques continus. Il vise plus précisément à améliorer les structures de données dans les SIG en développant une structure de données hiérarchique qui est la base d’un automate cellulaire capable de répondre aux principales caractéristiques de ces processus. L’exploration du potentiel des automates cellulaires pour simuler et représenter les processus dynamiques continus dans les SIG en respectant leur caractère irrégulier et hiérarchique fait l’objet de ce travail de recherche dans lequel une application dans le contexte hydrologique est mise en place. Nos objectifs spécifiques se résument dans 1) la construction d’une tessellation irrégulière et hiérarchique permettant de représenter les processus spatiotemporels et 2) la simulation de ces processus en utilisant un automate cellulaire opérant sur cette tessellation. Nous étudions la discrétisation de l’espace en tessellation irrégulière basée sur le diagramme de Voronoï et nous proposons une procédure de hiérarchisation de cette tessellation dans un objectif de représentation multi-échelle afin d’offrir une solution d’aide à la décision dans la gestion du territoire. Nous expliquons notre méthodologie et les algorithmes de sélection de données pour la génération de différents niveaux d’échelles spatiales. Un automate cellulaire non traditionnel est mis en place pour lequel nous définissons une grille à géométrie irrégulière de type Voronoï, des règles de transition spécifiques et un type particulier de voisinage orienté. Nous validons le fonctionnement de ce prototype dans le Bassin Expérimental de la Forêt Montmorency à Québec où des comparaisons sont possibles grâce à des données de débits d’eau mesurées in situ.Geographic information systems (GIS) are widely used to represent, manage and analyse spatial data in many disciplines including geosciences, agriculture, forestry, meteorology and oceanography. However, despite recent advances in GIS technologies, they are still limited when it comes to representation and simulation of spatiotemporal processes. This research work, deals with a theoretical, conceptual and practical framework which aims to improve the representation of dynamic continuous processes. It aims especially to improve GIS capabilities by developing a CA based on a hierarchical irregular tessellation which is able to take into account the main characteristics of these processes. The exploration of the cellular automata potential to simulate and represent dynamic continuous processes regarding their irregular and hierarchic characteristics is the subject of this work where an application in the hydrologic field is established. Our specific objectives are 1) to build an irregular and hierarchic grid that can be used to represent spatiotemporal processes, 2) to simulate those processes with a cellular automata operating on this grid. We give details about the irregular geometric grid based on a Voronoï Diagram, the characteristics of a specific oriented neighbourhood and the transition rules that are governing the cells update. In addition, we discuss the hierarchical perspective of the build lattice that is essential for easy move between different spatial scales. We explain our methodology of data selection in order to generate the spatial levels of representation by demonstrating the used selection algorithms. This facilitates the representation of spatial dynamic phenomena and contributes to the better understanding of the complex behaviour of the whole system at different levels of details. We also present the data structures and general functioning of the whole simulation system. We finally, validate our framework by simulating the water flow process in a specific watershed in the region of Montmorency Forest of Quebec where in situ data are available. To validate our simulation results we compare them with measured data
    • …
    corecore