643 research outputs found
Recommended from our members
Semantics-Space-Time Cube. A Conceptual Framework for Systematic Analysis of Texts in Space and Time
We propose an approach to analyzing data in which texts are associated with spatial and temporal references with the aim to understand how the text semantics vary over space and time. To represent the semantics, we apply probabilistic topic modeling. After extracting a set of topics and representing the texts by vectors of topic weights, we aggregate the data into a data cube with the dimensions corresponding to the set of topics, the set of spatial locations (e.g., regions), and the time divided into suitable intervals according to the scale of the planned analysis. Each cube cell corresponds to a combination (topic, location, time interval) and contains aggregate measures characterizing the subset of the texts concerning this topic and having the spatial and temporal references within these location and interval. Based on this structure, we systematically describe the space of analysis tasks on exploring the interrelationships among the three heterogeneous information facets, semantics, space, and time. We introduce the operations of projecting and slicing the cube, which are used to decompose complex tasks into simpler subtasks. We then present a design of a visual analytics system intended to support these subtasks. To reduce the complexity of the user interface, we apply the principles of structural, visual, and operational uniformity while respecting the specific properties of each facet. The aggregated data are represented in three parallel views corresponding to the three facets and providing different complementary perspectives on the data. The views have similar look-and-feel to the extent allowed by the facet specifics. Uniform interactive operations applicable to any view support establishing links between the facets. The uniformity principle is also applied in supporting the projecting and slicing operations on the data cube. We evaluate the feasibility and utility of the approach by applying it in two analysis scenarios using geolocated social media data for studying people's reactions to social and natural events of different spatial and temporal scales
Data Visualization in Business Intelligent &Analysis – Analysis of First Positioned Tools According to Gartner’s Magic Quadrant in Ability to Execute
Data Visualization tools in Business Intelligent (BI) and Analysis are very effective because they allow gaining of deeper understanding of huge amounts of data stored in databases. For this reasons many market research companies take into consideration usage of Data Visualization tools as part of their BI solutions and analyze their competitive advantage at the market as well as the benefits and disadvantages. In this paper, the Data Visualization tools that are on the top of Gartner and Forrester researches, Tableau and Qlik, are taken into consideration. They are positioned higher on the “Ability to execute” axis and\ud
according to researchers’ report, are faster growing sales tools and deserve analyses in details. They are used as Visual Data Analysis (VDA) tools from theoretical and practical side and are analyzed for previous defined Key\ud
Performance Indicators in order to gain deeper insights and make a comparison of their ability to execute
OLEMAR: An Online Environment for Mining Association Rules in Multidimensional Data
Data warehouses and OLAP (online analytical processing) provide tools to explore and navigate through data cubes in order to extract interesting information under different perspectives and levels of granularity. Nevertheless, OLAP techniques do not allow the identification of relationships, groupings, or exceptions that could hold in a data cube. To that end, we propose to enrich OLAP techniques with data mining facilities to benefit from the capabilities they offer. In this chapter, we propose an online environment for mining association rules in data cubes. Our environment called OLEMAR (online environment for mining association rules), is designed to extract associations from multidimensional data. It allows the extraction of inter-dimensional association rules from data cubes according to a sum-based aggregate measure, a more general indicator than aggregate values provided by the traditional COUNT measure. In our approach, OLAP users are able to drive a mining process guided by a meta-rule, which meets their analysis objectives. In addition, the environment is based on a formalization, which exploits aggregate measures to revisit the definition of the support and the confidence of discovered rules. This formalization also helps evaluate the interestingness of association rules according to two additional quality measures: lift and loevinger. Furthermore, in order to focus on the discovered associations and validate them, we provide a visual representation based on the graphic semiology principles. Such a representation consists in a graphic encoding of frequent patterns and association rules in the same multidimensional space as the one associated with the mined data cube. We have developed our approach as a component in a general online analysis platform called Miningcubes according to an Apriori-like algorithm, which helps extract inter-dimensional association rules directly from materialized multidimensional structures of data. In order to illustrate the effectiveness and the efficiency of our proposal, we analyze a real-life case study about breast cancer data and conduct performance experimentation of the mining process
Towards Geo Decision Support Systems for Renewable Energy Outreach
La Tierra se encuentra afectada por numerosos fenĂłmenos tales como los desastres naturales, sobre urbanizaciĂłn, contaminaciĂłn, etc. Todas estas actividades afectan enormemente a los recursos naturales del planeta llevando a la escasez de los mismos. Un tema especialmente relevante es el uso exhaustivo de energĂa fĂłsil y su impacto negativo sobre nuestro medio ambiente. Resulta de este modo fundamental la bĂşsqueda de nuevos recursos energĂ©ticos limpios para satisfacer nuestras necesidades y reducir la dependencia de recursos energĂ©ticos fĂłsiles. La transformaciĂłn de una infraestructura de generaciĂłn de energĂa basada en recursos fĂłsiles a otra basada en recursos energĂ©ticos renovables tales como eĂłlica, solar y energĂa hidroelĂ©ctrica llevará a un mejor mantenimiento del medio ambiente ya que supondrá poco o ningĂşn efecto en el calentamiento global por las emisiones, y a una reducciĂłn de la dependencia de fuentes de energĂa fĂłsil. Las energĂas renovables son una fuente natural de energĂa que tiene importantes beneficios ya que proporciona un sistema de producciĂłn de energĂa confiable, con precios de la energĂa estables, puestos de trabajo especializados, y beneficios econĂłmicos y el medio ambiente. La energĂa solar es una de las mejores energĂas renovables. El sol es la fuente natural y fundamental de la existencia humana sobre la tierra y afecta a todos los procesos quĂmicos, fĂsicos y biolĂłgicos. Una hora de la energĂa del sol en la tierra es suficiente para alimentar a todo el planeta durante un año. La energĂa del sol o la radiaciĂłn solar y su presencia geográfica determinan posibles inversiones en energĂa solar y las estrategias de desarrollo de las mismas. De este modo es esencial para poder proporcionar respuestas relacionadas con el "quĂ©, quiĂ©n, cuando y donde". Por ejemplo: ÂżCuál es el perfil de trabajo que mejor adapta a una posiciĂłn gerencial de las energĂas renovables? ÂżDĂłnde está el mejor lugar para invertir en huertos solares y/o parques eĂłlicos? ÂżEn quĂ© fecha se registra la más alta productividad? ÂżPor quĂ© este lugar no es apto para proyectos hidráulicos? ÂżPor quĂ© hay un bajĂłn en la radiaciĂłn solar en el año 2000 frente a 2012? Etc. En general, la toma de decisiones es el proceso de seleccionar la mejor opciĂłn viable de un conjunto de posibles maneras de hacer las cosas. Los Sistemas de Soporte de DecisiĂłn (del inglĂ©s Decision Support System, DSS) constituyen un ecosistema cognitivo que facilita la interacciĂłn entre los seres humanos y los datos para facilitar de forma profunda, significativa y Ăştil la creaciĂłn de soluciones efectivas en tiempo y costes. Grandes almacenamientos de Datos (Data warehousing), procesos de ExtracciĂłn, TransformaciĂłn y Carga (del inglĂ©s Extract Transform and Load, ETL) y la Inteligencia de Negocios (del ingles Business Intelligence, BI) son aspectos tecnolĂłgicos clave vinculados a la toma de decisiones. Además, la toma de decisiones en el contexto de la energĂa solar depende de Sistemas de InformaciĂłn Geográfica. Aunque la energĂa del Sol está disponible en todo el mundo, es evidente que la energĂa solar es más abundante cerca de los trĂłpicos. Por ejemplo, una inversiĂłn en plantas de energĂa fotovoltaica en lugares cerca de los trĂłpicos y del ecuador requerirá menos tiempo para su amortizaciĂłn. Dependiendo de la ubicaciĂłn geográfica y las condiciones climáticas, la intensidad solar varĂa. Por esta razĂłn, es importante seleccionar la ubicaciĂłn adecuada que optimice la inversiĂłn teniendo en cuenta factores como la intensidad de la radiaciĂłn solar, clima, tierras aptas y economĂa. Hay modelos como Global atlas y SimuSOLAR que dan informaciĂłn de idoneidad sobre la radiaciĂłn solar y las ubicaciones. Sin embargo, estos modelos están restringidos a expertos, cubren áreas geográficas limitadas, no son aptos para casos de uso diferentes de los inicialmente previstos, y adolecen de falta de informes detallados e intuitivos para el pĂşblico en general. El desarrollo de una cartografĂa extensa sobre la relaciĂłn de zonas de sol y de sombra es un trabajo muy complejo que involucra diversos conceptos y retos de ingenierĂa, necesitando de la integraciĂłn de diferentes modelos de datos, de calidad y cantidad heterogĂ©neas, con limitaciones presupuestarias, etc. El objetivo de los trabajos de investigaciĂłn desarrollados ha sido establecer la arquitectura de software para el desarrollo de Sistemas de Soporte de DecisiĂłn en el ámbito de las energĂas renovables en general, y de la energĂa solar en particular. La caracterĂstica clave de este enfoque de arquitectura de software es ser capaz de proporcionar Sistemas de Soporte de DecisiĂłn que ofrezcan servicios de bajo coste ("low cost") en este contexto. Hagamos una analogĂa. ImagĂnese que usted está buscando comprar o alquilar una casa en España. Quiere analizar las caracterĂsticas del edificio (por ejemplo dimensiones, jardĂn, más de una edificaciĂłn en la parcela) y su entorno (por ejemplo, conexiones, servicios). Para realizar esta tarea puede utilizar los datos gratuitos proporcionados por la Oficina Virtual del Catastro de España junto con imágenes libres de un proveedor de ortofotografĂas (por ejemplo PNOA, Google o Bing) y datos contextuales libres procedentes de otros organismos locales, regionales y/o nacionales (por ejemplo el Ayuntamiento de Zaragoza, el Gobierno de AragĂłn, el proyecto Cartociudad). Si alguien integra todos estos orĂgenes de datos en un sistema (por ejemplo el cliente del servicio de mapas de la Infraestructura de Datos Espaciales de España, IDEE), tiene un Sistema de Soporte de DecisiĂłn "low cost" para comprar o alquilar una casa. Este trabajo de investigaciĂłn tiene como objetivo el desarrollo de un enfoque de arquitectura de software que podrĂa proporcionar un Sistema de Soporte de DecisiĂłn "low cost" cuando los consumidores necesitan tomar decisiones relacionadas con las energĂas renovables, en particular sistemas de energĂa solar, como podrĂa ser la selecciĂłn de la mejor opciĂłn para instalar un sistema solar, o decidir una inversiĂłn en una granja solar comunitaria. Una parte importante de este proceso de investigaciĂłn ha consistido en el análisis sobre la idoneidad de las tecnologĂas vinculadas a Grandes almacenamientos de Datos y procesos de ExtracciĂłn, TransformaciĂłn y Carga para almacenar y procesar gran cantidad de datos histĂłricos referentes a la energĂa, e Inteligencia de Negocios para la estructuraciĂłn y presentaciĂłn de informes. Por otro lado, ha sido necesario centrar el trabajo en modelos de negocio abierto (infraestructura de servicios web, modelos de datos 3D, tĂ©cnicas de representaciĂłn de datos sobre zonas de sol y sombra, y fuentes de datos) para el desarrollo econĂłmico del producto. Además, este trabajo identifica casos de uso donde los Sistemas de Soporte de DecisiĂłn deben ser el instrumento de resoluciĂłn de problemas de mercado y de problemas cientĂficos. Por lo tanto, esta tesis tiene como objetivo enfatizar y adoptar las tecnologĂas citadas para proponer un Sistema de Soporte de DecisiĂłn completo para un mejor uso potencial de las energĂas renovables que denominamos REDSS (del inglĂ©s Renewable Energy Decision Support System). El trabajo de investigaciĂłn ha sido desarrollado con el objeto de encontrar respuestas a las siguientes preguntas de investigaciĂłn: Preguntas relacionadas a los datos: - ÂżCĂłmo elegir el proceso de creaciĂłn de datos más adecuado para crear modelos geográficos cuyo coste econĂłmico sea razonable? Preguntas relacionadas con la tecnologĂa: - ÂżQuĂ© limitaciones tecnolĂłgicas actuales tienen las herramientas computacionales para el cálculo de la intensidad y sombra solar? - ÂżCĂłmo se puede adaptar conceptos como Grandes almacenamientos de Datos y la Inteligencia de Negocios en el campo de las energĂas renovables? - ÂżCĂłmo estructurar y organizar datos relacionados con la intensidad solar y la sombra? - ÂżCuáles son las diferencias significativas entre el mĂ©todo propuesto y otros servicios globales existentes? Preguntas relacionadas con casos de uso: - ÂżCuáles son los casos de uso de REDSS? - ÂżCuáles son los beneficios de REDSS para expertos y pĂşblico en general? Para darle una forma concreta a la contribuciĂłn y el enfoque propuesto, se ha desarrollado un prototipo denominado Energy2People basado en principios de Inteligencia de Negocio que no sĂłlo proporciona datos de localizaciĂłn avanzada sino que es una base sobre la que para desarrollar futuros productos comerciales. En su conformaciĂłn actual, esta herramienta ayuda a descubrir y representar las relaciones de datos clave en el sector de las energĂas renovables y, permite descubrir al pĂşblico en general relaciones entre los datos en casos donde no era evidente. Esencialmente, el enfoque propuesto conduce a un aumento en el rendimiento de gestiĂłn y visualizaciĂłn de datos. Las principales aportaciones de esta tesis pueden resumirse como siguen: - En primer lugar, esta tesis hace una revisiĂłn de varios modelos de sol-sombra de cĂłdigo abierto y cerrado para identificar el alcance de la necesidad de modelos de decisiĂłn y de su soporte efectivo. Además, proporciona informaciĂłn detallada sobre fuentes de informaciĂłn gratuita relacionada con datos de radiaciĂłn solar. - En segundo lugar, se plantea un armazĂłn conceptual para el desarrollo de modelos geográficos de bajo coste. Como ejemplo de la aplicaciĂłn de esta aproximaciĂłn se ha desarrollado un modelo de bajo coste de ciudad virtual 3D utilizando datos catastrales pĂşblicamente disponibles vĂa servicios Web. - En tercer lugar, este trabajo propone el uso de REDSS al problema de la toma de decisiones en el campo de la energĂa solar. Este modelo tambiĂ©n cuenta con otros puntos distinguibles como los enfoques de co-creaciĂłn y Mix-and-match. - En cuarto lugar, esta tesis identifica varios escenarios de aplicaciones reales y varios tipos de actores que deberĂan salir beneficiados por la aplicaciĂłn de esta estrategia. - Por Ăşltimo, esta tesis presenta el prototipo "Enery2People" desarrollado para explorar datos de localizaciĂłn de la radiaciĂłn solar y eventos temporales que sirve como ejemplo práctico de la aproximaciĂłn planteada en esta tesis. Para hacer más claro el potencial del enfoque propuesto, este prototipo es comparado con otros Atlas Internacionales de la energĂa renovable
To Develop a Database Management Tool for Multi-Agent Simulation Platform
Depuis peu, la Modélisation et Simulation par Agents (ABMs) est passée d'une approche dirigée par les modèles à une approche dirigée par les données (Data Driven Approach, DDA). Cette tendance vers l’utilisation des données dans la simulation vise à appliquer les données collectées par les systèmes d’observation à la simulation (Edmonds and Moss, 2005; Hassan, 2009). Dans la DDA, les données empiriques collectées sur les systèmes cibles sont utilisées non seulement pour la simulation des modèles mais aussi pour l’initialisation, la calibration et l’évaluation des résultats issus des modèles de simulation, par exemple, le système d’estimation et de gestion des ressources hydrauliques du bassin Adour-Garonne Français (Gaudou et al., 2013) et l’invasion des rizières du delta du Mékong au Vietnam par les cicadelles brunes (Nguyen et al., 2012d). Cette évolution pose la question du « comment gérer les données empiriques et celles simulées dans de tels systèmes ». Le constat que l’on peut faire est que, si la conception et la simulation actuelles des modèles ont bénéficié des avancées informatiques à travers l’utilisation des plateformes populaires telles que Netlogo (Wilensky, 1999) ou GAMA (Taillandier et al., 2012), ce n'est pas encore le cas de la gestion des données, qui sont encore très souvent gérées de manière ad-hoc. Cette gestion des données dans des Modèles Basés Agents (ABM) est une des limitations actuelles des plateformes de simulation multiagents (SMA). Autrement dit, un tel outil de gestion des données est actuellement requis dans la construction des systèmes de simulation par agents et la gestion des bases de données correspondantes est aussi un problème important de ces systèmes. Dans cette thèse, je propose tout d’abord une structure logique pour la gestion des données dans des plateformes de SMA. La structure proposée qui intègre des solutions de l’Informatique Décisionnelle et des plateformes multi-agents s’appelle CFBM (Combination Framework of Business intelligence and Multi-agent based platform), elle a plusieurs objectifs : (1) modéliser et exécuter des SMAs, (2) gérer les données en entrée et en sortie des simulations, (3) intégrer les données de différentes sources, et (4) analyser les données à grande échelle. Ensuite, le besoin de la gestion des données dans les simulations agents est satisfait par une implémentation de CFBM dans la plateforme GAMA. Cette implémentation présente aussi une architecture logicielle pour combiner entrepôts deIv données et technologies du traitement analytique en ligne (OLAP) dans les systèmes SMAs. Enfin, CFBM est évaluée pour la gestion de données dans la plateforme GAMA à travers le développement de modèles de surveillance des cicadelles brunes (BSMs), où CFBM est utilisé non seulement pour gérer et intégrer les données empiriques collectées depuis le système cible et les résultats de simulation du modèle simulé, mais aussi calibrer et valider ce modèle. L'intérêt de CFBM réside non seulement dans l'amélioration des faiblesses des plateformes de simulation et de modélisation par agents concernant la gestion des données mais permet également de développer des systèmes de simulation complexes portant sur de nombreuses données en entrée et en sortie en utilisant l’approche dirigée par les données.Recently, there has been a shift from modeling driven approach to data driven approach inAgent Based Modeling and Simulation (ABMS). This trend towards the use of data-driven approaches in simulation aims at using more and more data available from the observation systems into simulation models (Edmonds and Moss, 2005; Hassan, 2009). In a data driven approach, the empirical data collected from the target system are used not only for the design of the simulation models but also in initialization, calibration and evaluation of the output of the simulation platform such as e.g., the water resource management and assessment system of the French Adour-Garonne Basin (Gaudou et al., 2013) and the invasion of Brown Plant Hopper on the rice fields of Mekong River Delta region in Vietnam (Nguyen et al., 2012d). That raises the question how to manage empirical data and simulation data in such agentbased simulation platform. The basic observation we can make is that currently, if the design and simulation of models have benefited from advances in computer science through the popularized use of simulation platforms like Netlogo (Wilensky, 1999) or GAMA (Taillandier et al., 2012), this is not yet the case for the management of data, which are still often managed in an ad hoc manner. Data management in ABM is one of limitations of agent-based simulation platforms. Put it other words, such a database management is also an important issue in agent-based simulation systems. In this thesis, I first propose a logical framework for data management in multi-agent based simulation platforms. The proposed framework is based on the combination of Business Intelligence solution and a multi-agent based platform called CFBM (Combination Framework of Business intelligence and Multi-agent based platform), and it serves several purposes: (1) model and execute multi-agent simulations, (2) manage input and output data of simulations, (3) integrate data from different sources; and (4) analyze high volume of data. Secondly, I fulfill the need for data management in ABM by the implementation of CFBM in the GAMA platform. This implementation of CFBM in GAMA also demonstrates a software architecture to combine Data Warehouse (DWH) and Online Analytical Processing (OLAP) technologies into a multi-agent based simulation system. Finally, I evaluate the CFBM for data management in the GAMA platform via the development of a Brown Plant Hopper Surveillance Models (BSMs), where CFBM is used ii not only to manage and integrate the whole empirical data collected from the target system and the data produced by the simulation model, but also to calibrate and validate the models.The successful development of the CFBM consists not only in remedying the limitation of agent-based modeling and simulation with regard to data management but also in dealing with the development of complex simulation systems with large amount of input and output data supporting a data driven approach
To Develop a Database Management Tool for Multi-Agent Simulation Platform
Depuis peu, la Modélisation et Simulation par Agents (ABMs) est passée d'une approche dirigée par les modèles à une approche dirigée par les données (Data Driven Approach, DDA). Cette tendance vers l’utilisation des données dans la simulation vise à appliquer les données collectées par les systèmes d’observation à la simulation (Edmonds and Moss, 2005; Hassan, 2009). Dans la DDA, les données empiriques collectées sur les systèmes cibles sont utilisées non seulement pour la simulation des modèles mais aussi pour l’initialisation, la calibration et l’évaluation des résultats issus des modèles de simulation, par exemple, le système d’estimation et de gestion des ressources hydrauliques du bassin Adour-Garonne Français (Gaudou et al., 2013) et l’invasion des rizières du delta du Mékong au Vietnam par les cicadelles brunes (Nguyen et al., 2012d). Cette évolution pose la question du « comment gérer les données empiriques et celles simulées dans de tels systèmes ». Le constat que l’on peut faire est que, si la conception et la simulation actuelles des modèles ont bénéficié des avancées informatiques à travers l’utilisation des plateformes populaires telles que Netlogo (Wilensky, 1999) ou GAMA (Taillandier et al., 2012), ce n'est pas encore le cas de la gestion des données, qui sont encore très souvent gérées de manière ad-hoc. Cette gestion des données dans des Modèles Basés Agents (ABM) est une des limitations actuelles des plateformes de simulation multiagents (SMA). Autrement dit, un tel outil de gestion des données est actuellement requis dans la construction des systèmes de simulation par agents et la gestion des bases de données correspondantes est aussi un problème important de ces systèmes. Dans cette thèse, je propose tout d’abord une structure logique pour la gestion des données dans des plateformes de SMA. La structure proposée qui intègre des solutions de l’Informatique Décisionnelle et des plateformes multi-agents s’appelle CFBM (Combination Framework of Business intelligence and Multi-agent based platform), elle a plusieurs objectifs : (1) modéliser et exécuter des SMAs, (2) gérer les données en entrée et en sortie des simulations, (3) intégrer les données de différentes sources, et (4) analyser les données à grande échelle. Ensuite, le besoin de la gestion des données dans les simulations agents est satisfait par une implémentation de CFBM dans la plateforme GAMA. Cette implémentation présente aussi une architecture logicielle pour combiner entrepôts deIv données et technologies du traitement analytique en ligne (OLAP) dans les systèmes SMAs. Enfin, CFBM est évaluée pour la gestion de données dans la plateforme GAMA à travers le développement de modèles de surveillance des cicadelles brunes (BSMs), où CFBM est utilisé non seulement pour gérer et intégrer les données empiriques collectées depuis le système cible et les résultats de simulation du modèle simulé, mais aussi calibrer et valider ce modèle. L'intérêt de CFBM réside non seulement dans l'amélioration des faiblesses des plateformes de simulation et de modélisation par agents concernant la gestion des données mais permet également de développer des systèmes de simulation complexes portant sur de nombreuses données en entrée et en sortie en utilisant l’approche dirigée par les données.Recently, there has been a shift from modeling driven approach to data driven approach inAgent Based Modeling and Simulation (ABMS). This trend towards the use of data-driven approaches in simulation aims at using more and more data available from the observation systems into simulation models (Edmonds and Moss, 2005; Hassan, 2009). In a data driven approach, the empirical data collected from the target system are used not only for the design of the simulation models but also in initialization, calibration and evaluation of the output of the simulation platform such as e.g., the water resource management and assessment system of the French Adour-Garonne Basin (Gaudou et al., 2013) and the invasion of Brown Plant Hopper on the rice fields of Mekong River Delta region in Vietnam (Nguyen et al., 2012d). That raises the question how to manage empirical data and simulation data in such agentbased simulation platform. The basic observation we can make is that currently, if the design and simulation of models have benefited from advances in computer science through the popularized use of simulation platforms like Netlogo (Wilensky, 1999) or GAMA (Taillandier et al., 2012), this is not yet the case for the management of data, which are still often managed in an ad hoc manner. Data management in ABM is one of limitations of agent-based simulation platforms. Put it other words, such a database management is also an important issue in agent-based simulation systems. In this thesis, I first propose a logical framework for data management in multi-agent based simulation platforms. The proposed framework is based on the combination of Business Intelligence solution and a multi-agent based platform called CFBM (Combination Framework of Business intelligence and Multi-agent based platform), and it serves several purposes: (1) model and execute multi-agent simulations, (2) manage input and output data of simulations, (3) integrate data from different sources; and (4) analyze high volume of data. Secondly, I fulfill the need for data management in ABM by the implementation of CFBM in the GAMA platform. This implementation of CFBM in GAMA also demonstrates a software architecture to combine Data Warehouse (DWH) and Online Analytical Processing (OLAP) technologies into a multi-agent based simulation system. Finally, I evaluate the CFBM for data management in the GAMA platform via the development of a Brown Plant Hopper Surveillance Models (BSMs), where CFBM is used ii not only to manage and integrate the whole empirical data collected from the target system and the data produced by the simulation model, but also to calibrate and validate the models.The successful development of the CFBM consists not only in remedying the limitation of agent-based modeling and simulation with regard to data management but also in dealing with the development of complex simulation systems with large amount of input and output data supporting a data driven approach
Energy4People: Sistema de soporte para la toma de decisiones en el dominio de las energĂas renovables orientado al usuario no experto
Este proyecto propone un sistema de soporte a la toma de decisiones, en el dominio de las energĂas renovables y orientado a usuarios no expertos. El sistema utiliza de manera transparente para el usuario tĂ©cnicas de BI como la integraciĂłn de datos, que ha sido aplicada a datos procedentes de satĂ©lites de la NASA, estructuras multidimensionales como cubos OLAP y modelos de datos orientados al análisis como el esquema de estrella de un data warehouse. Con este sistema, por ejemplo, un usuario no experto puede visualizar y entender dĂłnde es mejor realizar una inversiĂłn en paneles solares
A conceptual framework and a risk management approach for interoperability between geospatial datacubes
De nos jours, nous observons un intérêt grandissant pour les bases de données géospatiales multidimensionnelles. Ces bases de données sont développées pour faciliter la prise de décisions stratégiques des organisations, et plus spécifiquement lorsqu’il s’agit de données de différentes époques et de différents niveaux de granularité. Cependant, les utilisateurs peuvent avoir besoin d’utiliser plusieurs bases de données géospatiales multidimensionnelles. Ces bases de données peuvent être sémantiquement hétérogènes et caractérisées par différent degrés de pertinence par rapport au contexte d’utilisation. Résoudre les problèmes sémantiques liés à l’hétérogénéité et à la différence de pertinence d’une manière transparente aux utilisateurs a été l’objectif principal de l’interopérabilité au cours des quinze dernières années. Dans ce contexte, différentes solutions ont été proposées pour traiter l’interopérabilité. Cependant, ces solutions ont adopté une approche non systématique. De plus, aucune solution pour résoudre des problèmes sémantiques spécifiques liés à l’interopérabilité entre les bases de données géospatiales multidimensionnelles n’a été trouvée. Dans cette thèse, nous supposons qu’il est possible de définir une approche qui traite ces problèmes sémantiques pour assurer l’interopérabilité entre les bases de données géospatiales multidimensionnelles. Ainsi, nous définissons tout d’abord l’interopérabilité entre ces bases de données. Ensuite, nous définissons et classifions les problèmes d’hétérogénéité sémantique qui peuvent se produire au cours d’une telle interopérabilité de différentes bases de données géospatiales multidimensionnelles. Afin de résoudre ces problèmes d’hétérogénéité sémantique, nous proposons un cadre conceptuel qui se base sur la communication humaine. Dans ce cadre, une communication s’établit entre deux agents système représentant les bases de données géospatiales multidimensionnelles impliquées dans un processus d’interopérabilité. Cette communication vise à échanger de l’information sur le contenu de ces bases. Ensuite, dans l’intention d’aider les agents à prendre des décisions appropriées au cours du processus d’interopérabilité, nous évaluons un ensemble d’indicateurs de la qualité externe (fitness-for-use) des schémas et du contexte de production (ex., les métadonnées). Finalement, nous mettons en œuvre l’approche afin de montrer sa faisabilité.Today, we observe wide use of geospatial databases that are implemented in many forms (e.g., transactional centralized systems, distributed databases, multidimensional datacubes). Among those possibilities, the multidimensional datacube is more appropriate to support interactive analysis and to guide the organization’s strategic decisions, especially when different epochs and levels of information granularity are involved. However, one may need to use several geospatial multidimensional datacubes which may be semantically heterogeneous and having different degrees of appropriateness to the context of use. Overcoming the semantic problems related to the semantic heterogeneity and to the difference in the appropriateness to the context of use in a manner that is transparent to users has been the principal aim of interoperability for the last fifteen years. However, in spite of successful initiatives, today's solutions have evolved in a non systematic way. Moreover, no solution has been found to address specific semantic problems related to interoperability between geospatial datacubes. In this thesis, we suppose that it is possible to define an approach that addresses these semantic problems to support interoperability between geospatial datacubes. For that, we first describe interoperability between geospatial datacubes. Then, we define and categorize the semantic heterogeneity problems that may occur during the interoperability process of different geospatial datacubes. In order to resolve semantic heterogeneity between geospatial datacubes, we propose a conceptual framework that is essentially based on human communication. In this framework, software agents representing geospatial datacubes involved in the interoperability process communicate together. Such communication aims at exchanging information about the content of geospatial datacubes. Then, in order to help agents to make appropriate decisions during the interoperability process, we evaluate a set of indicators of the external quality (fitness-for-use) of geospatial datacube schemas and of production context (e.g., metadata). Finally, we implement the proposed approach to show its feasibility
- …