12 research outputs found

    The impact of spatial data redundancy on SOLAP query performance

    Get PDF
    Geographic Data Warehouses (GDW) are one of the main technologies used in decision-making processes and spatial analysis, and the literature proposes several conceptual and logical data models for GDW. However, little effort has been focused on studying how spatial data redundancy affects SOLAP (Spatial On-Line Analytical Processing) query performance over GDW. In this paper, we investigate this issue. Firstly, we compare redundant and non-redundant GDW schemas and conclude that redundancy is related to high performance losses. We also analyze the issue of indexing, aiming at improving SOLAP query performance on a redundant GDW. Comparisons of the SB-index approach, the star-join aided by R-tree and the star-join aided by GiST indicate that the SB-index significantly improves the elapsed time in query processing from 25% up to 99% with regard to SOLAP queries defined over the spatial predicates of intersection, enclosure and containment and applied to roll-up and drill-down operations. We also investigate the impact of the increase in data volume on the performance. The increase did not impair the performance of the SB-index, which highly improved the elapsed time in query processing. Performance tests also show that the SB-index is far more compact than the star-join, requiring only a small fraction of at most 0.20% of the volume. Moreover, we propose a specific enhancement of the SB-index to deal with spatial data redundancy. This enhancement improved performance from 80 to 91% for redundant GDW schemas.FAPESPCNPqCoordenacao de Aperfeicoamento de Pessoal de Nivel Superior (CAPES)INEPFINE

    Estado actual de las tecnologías de bodega de datos y olap aplicadas a bases de datos espaciales

    Get PDF
    Las organizaciones requieren de una información oportuna, dinámica, amigable, centralizada y de fácil acceso para analizar y tomar decisiones acertadas y correctas en el momento preciso. La centralización se logra con la tecnología de bodega de datos. El análisis lo proporcionan los sistemas de procesamiento analítico en línea, OLAP (On Line Analytical Processing). Y en la presentación de los datos se pueden aprovechar tecnologías que usen gráficos y mapas para tener una visión global de la compañía y así tomar mejores decisiones. Aquí son útiles los sistemas de información geográfica, SIG, que están diseñados para ubicar espacialmente la información y representarla por medio de mapas. Las bodegas de datos generalmente se implementan con el modelo multidimensional para facilitar los análisis con OLAP. Uno de los puntos fundamentales de este modelo es la definición de medidas y de dimensiones, entre las cuales está la geografía. Diversos investigadores del tema han concluido que en los sistemas de análisis actuales la dimensión geográfica es un atributo más que describe los datos, pero sin profundizar en su parte espacial y sin ubicarlos en un mapa, como si se hace en los SIG. Visto de esa manera, es necesaria la interoperabilidad entre SIG y OLAP (que ha recibido el nombre de Spatial OLAP o SOLAP) y diversas entidades han adelantado varios trabalos de investigación para lograrla.Organisations require their information on a timely, dynamic, friendly, centralised and easy-to-access basis for analysing it and taking correct decisions at the right time. Centralisation can be achieved with data warehouse technology. On-line analytical processing (OLAP) is used for analysis. Technologies using graphics and maps in data presentation can be exploited for an overall view of a company and helping to take better decisions. Geo- graphic information systems (GIS) are useful for spatially locating information and representing it using maps. Data warehouses are generally implemented with a multidimensional data model to make OLAP analysis easier. A fundamental point in this model is the definition of measurements and dimensions; geography lies within such dimensions. Many researchers have concluded that the geographic dimension is another attribute for describing data in current analysis systems but without having an in-depth study of its spatial feature and without locating them on a map, like GIS does. Seen this way, interoperability is necessary between GIS and OLAP (called spatial OLAP or SOLAP) and several entities are currently researching this. This document summarises the current status of such research

    Modelo de bodega de datos para el manejo de variables matriciales

    Get PDF
    Los pictogramas (iconos) en los modelos conceptuales de bodegas de datos son elementos esenciales en el desarrollo de campos de estudio como la medicina, la geo- informática o la biología, estos aumentan la expresividad de los modelos y facilitan la construcción y el entendimiento de los mismos. Los pictogramas permiten representar estructuras complejas como trayectorias, puntos de interés, roles, entre otros. Por su parte, las aplicaciones espacio-temporales, promueven el uso de tipos datos no convencionales como los objetos geométricos. Sin embargo, se observa una carencia de pictogramas para representar elementos del álgebra matricial como vectores y matrices, las cuales son ampliamente usadas en disciplinas como biología, análisis de imágenes o contabilidad. En este trabajo se presentan pictogramas que representan elementos propios del álgebra matricial como vectores, matrices u operaciones, lo que permite la generación de modelos conceptuales de bodegas de datos en áreas que usan álgebra matricial como insumo para la construcción de modelos matemáticos como la contabilidad matricial; allí, el uso de matrices, vectores y operaciones facilitan la consolidación de los estados financieros. La transformación de modelos conceptuales de bodegas de datos en modelos lógicos sobre sistemas de gestión de bodegas de datos facilita el planteamiento de consultas al incorporar funciones que operen tipos de datos complejos como arreglos de una dimensión (vectores) y de dos dimensiones (matrices), lo que enriquece a su vez el lenguaje SQL.Abstract: Pictograms (icons) in conceptual models of data warehouses are essential elements in the development of fields of study such as medicine, geoinformatics or biology, these increase the expressiveness of models and facilitate the construction and understanding thereofs. Pictograms allow for the depiction of complex structures such as trajectories, points of interest, roles, among others. For its part, the space temporary applications promotes the use of unconventional data types as Geometric objects. However, It is noticeable a lack of pictograms to represent matrix algebra elements like vectors and matrices, which are widely used in disciplines such as biology, image analysis or accounting. In this research paper are presented pictograms that represent elements of matrix algebra as vectors, matrices or operations, allowing the generation of conceptual models of data warehouses in areas that use matrix algebra as input for the construction of mathematical models such as matrix accounting, There, the use of matrices, vectors and operations facilitate the consolidation of financial statements. Transforming conceptual models of data warehouses into logical models over database management systems facilitates the queries proposal by incorporating functions that opérate complex data types such as one-dimensional arrays (vectors) and two-dimensional arrays (matrices), enriching in turn the SQL language. Which enriches in turn the SQL language.Maestrí

    Context-based routing in road networks

    Get PDF
    Mestrado em Engenharia de Computadores e TelemáticaA utilização de sistemas de geo-localização já faz parte do quotidiano das pessoas, através dos mais variados equipamentos de recepção de dados posicionais. Com o aumento de utilização deste tipo de equipamentos, a estruturas de armazenamento associadas a dados geográficos foram aperfeiçoadas de forma a permitir uma gestão mais eficiente. Neste trabalho é apresentado uma Data Warehouse espacial orientado ao contexto para o armazenamento de dados relativos ao tráfego automóvel. Esses dados são obtidos através de dados posicionais e representados num mapa rodoviário digital. O mapeamento é analisado através da comparação das similaridades de trajectos criados a partir de dados posicionais de veiculos em Aalborg (Dinamarca), usando diferentes períodos de amostragem. Após o armazenamento dos trajectos, dos dados posicionais e dos troços percorridos em três Data Marts distintas, foi feita uma análise de rotas em zonas residenciais, estradas secundárias e em pontos turísticos em Pequim (China). Através da análise faz-se a relação entre as rotas mais rápidas, as mais curtas, o número de paragens e o contexto em que esses dados foram registados. A análise mostra que, nas zonas de estradas secundárias as rotas utilizadas com mais frequência são na maioria dos casos a rota mais rápida, o que não acontece nas zonas residenciais e nas zonas turísticas. A análise mostrou que a relevância temporal influenciou o nível de tráfego e que o factor meteorológico não teve influência na escolha das rotas.The use of Geographic Information Systems is part of today's people's lives. As the use of these systems keeps growing, data storage and management structures are improving in order to allow a better use of spatio-temporal data. In this dissertation a Data Warehouse for traff ic and contextual storage is presented. The main data sources are GPS datasets and digital road maps. A map matching algorithm was implemented and evaluated using data from vehicles in Aalborg (Denmark). The data stored in three Data Marts, a route analysis in severa1 zones of Beijing city was presented. With this analysis, we show the relationship between the shortest routes, the fastest routes, the number of stoppages and the contextual data. The analysis shows that in secondary road zones, the routes used more frequently are usually the fastest routes. In residential zones and in turistic locations this conslusion was not found valid. It was concluded that time is a dimension that influences traffic levels, but no pattern was found beetween route selection and weather condition influenced the traffic level

    Visualização cartográfica assistida num ambiente SOLAP

    Get PDF
    Dissertação para obtenção do Grau de Mestre em Engenharia InformáticaO conceito Spatial OLAP introduz a visualização cartográfica nos sistemas Business Intelligent/OLAP. Esta tem grandes potencialidades para melhorar a análise de grandes quantidades de dados georreferenciados e o respetivo processo de tomada de decisão. O potencial que é possível obter da visualização cartográfica depende fortemente do uso apropriado não só das variáveis visuais como também de outros elementos que possam ser utilizados para representar informação no mapa (ex.: gráficos). Porém, num ambiente SOLAP, o analista deveria estar apenas focado em procurar informação útil abstraindo-se de como deve ser construída uma visualização cartográfica adequada. Neste trabalho, é proposto um modelo para assistir o utilizador na construção de visualizações cartográficas. O modelo proposto considera: (i) a meta-informação existente sobre os modelos multidimensionais; (ii) a interrogação realizada; (iii) os dados resultantes. Através do modelo proposto, pretende-se assistir o utilizador na construção de mapas temáticos apropriados. Neste trabalho é proposto: (i) um modelo para descrever tipos de visualização; (ii) um modelo para descrever o contexto analítico SOLAP; (iii) uma metodologia para a seleção adequada dos tipos de visualização aplicáveis em cada contexto analítico SOLAP e sua instanciação. O modelo de cartografia assistida em ambiente SOLAP proposto neste trabalho foi implementado sobre protótipo SOLAP+

    SOLAP+

    Get PDF
    Trabalho apresentado no âmbito do Mestrado em Engenharia Informática,como requisito parcial para obtenção do grau de Mestre em Engenharia InformáticaNo início do século XXI, Bédard propôs incorporar ao modelo multi-dimensional dados geográficos, originando o conceito SOLAP. Através deste conceito, os analistas puderam obter melhores análises das estruturas e relações de dados espaciais, mantendo as características benéficas que provêm dos sistemas OLAP, isto é, informação sumarizada, análise de dados a diferentes níveis de granularidade, exploração interactiva dos dados, etc. Devido à adequação dos sistemas SOLAP, face aos sistemas OLAP para o processo de suporte à decisão, algumas aplicações têm sido desenvolvidas. Porém, estas aplicações têm sido concebidas para um contexto específico. Com o propósito de se transpor esta limitação, vários foram os trabalhos que culminaram num modelo genérico SOLAP. Apesar de este modelo solucionar diversas limitações de aplicações anteriores, actualmente, não suporta análises com duas entidades espaciais em simultâneo, por exemplo “total de voos entre o aeroporto para o aeroporto ” ou “qual a quantidade de resíduos lançados por uma indústria no rio ?”. Por outro lado, a visualização dos mapas pode despoletar o efeito contrário ao desejado. Facilmente o mapa poderá ficar desorganizado devido ao excesso de objectos geográficos presentes, o que prejudica a visualização/análise de dados espaciais. Para dar resposta a estas questões, esta dissertação pretende estender o modelo SOLAP genérico, de modo a suportar análises onde estão presentes duas entidades espaciais em simultâneo e integrar algoritmos de agrupamento espacial, com o objectivo de garantir a visibilidade do mapa em situações de excesso de objectos geográficos

    Intégration et optimisation des grilles régulières de points dans une architecture SOLAP relationnelle

    Get PDF
    IRSTEA : PUB00043913Continuous fields are types of spatial representations used to model phenomena such as temperature, pollution or altitude. They are defined according to a mapping function f that assigns a value of the studied phenomenon to each p location of the studied area. Moreover, the representation of continuous fields at different scales or resolutions is often essential for effective spatial analysis. The advantage of continuous fields is the level of details generated by the continuity of the spatial data, and the quality of the spatial analysis provided by the multi-resolution. The downside of this type of spatial representations in the multidimensionnal analysis is the high cost of analysis and storage performances. Moreover, spatial data warehouses and spatial OLAP systems (EDS and SOLAP) are decision support systems that enable multidimensional spatial analysis of large volumes of spatial and non-spatial data. The analysis of continuous fields in SOLAP architecture represents an interesting research challenge. Various studies have focused on the integration of such representations in SOLAP system. However, this integration still at an early stage. Thus, this thesis focuses on the integration of incomplete continuous fields represented by a regular grid of points in the spatio-multidimensional analysis. This integration in the SOLAP system involves that the analysis of continuous fields must support:(i) conventional OLAP operators, (ii) Continuous spatial data, (iii) spatial operators (spatial slice), and (iv) querying data at different predefined levels of resolutions. In this thesis we propose differents approaches for the analysis of continuous fields in SOLAP system at different levels of the relational architecture (from the conceptual modeling to the optimization of computing performance). We propose a logical model FISS to optimize the performances of the multi-resolution analysis, based on interpolation methods. Then, we present a new methodology based on the Clustering sampling method, to optimize aggregation operations on regular grids of points in the relational SOLAP architecture.Les champs continus sont des types de représentations spatiales utilisées pour modéliser des phénomènes tels que la température, la pollution ou l’altitude. Ils sont définis selon une fonction de mapping f qui affecte une valeur du phénomène étudié à chaque localisation p du domaine d’étude. Par ailleurs, la représentation des champs continus à différentes échelles ou résolutions est souvent essentielle pour une analyse spatiale efficace. L’avantage des champs continus réside dans le niveau de détails généré par la continuité, ainsi que la qualité de l’analyse spatiale fournie par la multi-résolution. L’inconvénient de ce type de représentations dans l’analyse spatio-multidimensionnelle est le coût des performances d’analyse et de stockage. Par ailleurs, les entrepôts de données spatiaux et les systèmes OLAP spatiaux (EDS et SOLAP) sont des systèmes d’aide à la décision qui permettent l’analyse spatio-multidimensionnelle de grands volumes de données spatiales et non spatiales. L’analyse des champs continus dans l’architecture SOLAP représente un défi de recherche intéressant. Différents travaux se sont intéressés à l’intégration de ce type de représentations dans le système SOLAP. Cependant, celle-ci est toujours au stade embryonnaire. Cette thèse s’intéresse à l’intégration des champs continus incomplets représentés par une grille régulière de points dans l’analyse spatio-multidimensionnelle. Cette intégration dans le système SOLAP implique que l’analyse des champs continus doit supporter : (i) les opérateurs OLAP classiques, (ii) la vue continue des données spatiales, (iii) les opérateurs spatiaux (slice spatial) et (iv) l’interrogation des données à différentes résolutions prédéfinies. Dans cette thèse nous proposons différentes approches pour l’analyse des champs continus dans le SOLAP à différents niveaux de l’architecture relationnelle, de la modélisation conceptuelle à l’optimisation des performances de calcul. Nous proposons un modèle logique FISS qui permet d’optimiser les performances d’analyse à multi-résolution en se basant sur des méthodes d’interpolation. Puis, nous exposons une méthodologie basée sur la méthode d’échantillonnage du Clustering, qui permet d’optimiser les opérations d’agrégation des grilles régulières de points dans l’architecture SOLAP relationnelle en effectuant une estimation des résultats

    Conception et développement d'un service web de mise à jour incrémentielle pour les cubes de données spatiales

    Get PDF
    Les applications géodécisionnelles évoluent vers le temps réel et nécessitent un mécanisme de mise à jour rapide. Or, ce processus est complexe et très coûteux en temps de calcul à cause de la structure dénormalisée des données, stockées sous forme de cube. La méthode classique qui consistait à reconstruire entièrement le cube de données prend de plus en plus de temps au fur et à mesure que le cube grossit, et n'est plus envisageable. De nouvelles méthodes de mise à jour dites incrémentielles ont fait leurs preuves dans le domaine du Business Intelligence. Malheureusement, de telles méthodes n'ont jamais été transposées en géomatique décisionnelle, car les données géométriques nécessitent des traitements spécifiques et complexes. La mise à jour des cubes de données spatiales soulève des problèmes jusqu'alors inconnus dans les cubes de données classiques. En plus de cela, une large confusion règne autour de la notion de mise à jour dans les entrepôts de données. On remarque également que l'architecture des entrepôts de données suit la tendance actuelle d'évolution des architectures de systèmes informatiques vers une distribution des tâches et des ressources, au détriment des systèmes centralisés, et vers le développement de systèmes interopérables. Les architectures en émergence, dites orientées services deviennent dans ce sens très populaires. Cependant, les services dédiés à des tâches de mise à jour de cubes sont pour l'heure inexistants, même si ceux-ci représenteraient un apport indéniable pour permettre la prise de décision sur des données toujours à jour et cohérentes. Le but de ce mémoire est d'élaborer des méthodes de mise à jour incrémentielles pour les cubes spatiaux et d'inscrire le dispositif dans une architecture orientée services. La formulation de typologies pour la gestion de l'entrepôt de données et pour la mise à jour de cube a servi de base à la réflexion. Les méthodes de mise à jour incrémentielles existantes pour les cubes non spatiaux ont été passées en revue et ont permis d'imaginer de nouvelles méthodes incrémentielles adaptées aux cubes spatiaux. Pour finir, une architecture orientée services a été conçue, elle intègre tous les composants de l'entrepôt de données et contient le service web de mise à jour de cube, qui expose les différentes méthodes proposées

    Spatial hierarchies and topological relationships in the spatial multiDimER model

    No full text
    SCOPUS: cp.pinfo:eu-repo/semantics/publishe
    corecore