Search CORE

3,843 research outputs found

Performances de protocoles transactionnels en environnement mobile

Author: Bobineau Christophe
Labbé Cyril
Roncancio Claudia
Serrano-Alvarado Patricia
Publication venue: HAL CCSD
Publication date: 19/10/2004
Field of study

National audience. L'omniprésence d'unités mobiles et le développement des réseaux sans fil motivent des avancées en matière de supports d'exécution pour une grande variété d'applications en envi-ronnement mobile. Des efforts importants sont faits pour offrir une bonne gestion des données malgré les caractéristiques limitées de tels environnements. La notion de transaction a été ré-étudiée pour proposer des modèles et des protocoles permettant d'assurer certaines propriétés transactionnelles. Les algorithmes et protocoles proposés tentent d'optimiser l'utilisation des ressources des unités mobiles et de surmonter les limitations du réseau mobile. Dans cet article nous nous intéressons spécifiquement aux protocoles de validation de transactions réparties sur plusieurs unités dont certaines mobiles. Nous présentons ici les résultats d'un travail qui iden-tifie des propriétés qualitatives et des indices de performance quantitatifs, et étudie ceux-ci sur quatre protocoles (2PC, UCM, CO2PC et TCOT). Trois de ces protocoles sont des propositions spécifiques pour des environnements mobiles et sont représentatifs des propositions actuelles. Nous nous intéressons à la phase de validation des transactions, ainsi qu'à l'influence des dif-férents protocoles sur les performances du déroulement de l'ensemble des transactions. ABSTRACT. This is an abstract. The omnipresence of mobile devices and wireless networks lead to a growing interest in supporting a wide variety of applications in mobile environments. Numerous efforts in providing appropriate data managements for such environments are made. Transaction supports have been revisited to propose adapted transaction models and properties. Proposed algorithms and protocols try to optimise the use of mobile units resources and to overcome wireless network limitations. This work concerns protocols to commit transactions distributed over several mobile and fixed units. Results presented here concern the identification of qualitative properties and quantitative performance indices that are studied on four protocols (2PC, UCM, CO2PC et TCOT). Three of them are specifics propositions for mobile environments and are representative of current proposals. The analysis concerns the transaction validation phase as well as the impact of the protocols on the performances during a transaction execution itself. MOTS-CLÉS : transactions mobiles , evaluation de performances, protocoles de validation

Hal - Université Grenoble Alpes

HAL Descartes

Contributions à la réplication de données dans les systèmes distribués à grande échelle

Author: Monnet Sébastien
Publication venue: HAL CCSD
Publication date: 03/11/2015
Field of study

Data replication is a key mechanism for building a reliable and efficient data management system. Indeed, by keeping several replicas for each piece of data, it is possible to improve durability. Furthermore, well-placed copies reduce data accesstime. However, having multiple copies for a single piece of data creates consistency problems when the data is updated. Over the last years, I made contributions related to these three aspects: data durability, data access performance and data consistency. RelaxDHT and SPLAD enhance data durability by placing data copies smartly. Caju, AREN and POPS reduce access time by improving data locality and by taking popularity into account. To enhance data lookup performance, DONUT creates efficient shortcuts taking data distribution into account. Finally, in the replicated database context, Gargamel parallelizes independent transactions only, improving database performance and avoiding aborting transactions. My research has been carried out in collaboration with height PhD students, four of which have defended. In my future work, I plan to extend these contributions by (i) designing a storage system tailored for MMOGs, which are very demanding, and (ii) designing a data management system that is able to re-distribute data automatically in order to scale the number of servers up and down according to the changing workload, leading to a greener data management.La réplication de données est une technique clé pour permettre aux systèmes de gestion de données distribués à grande échelle d'offrir un stockage fiable et performant. Comme il gère un nombre suffisant de copies de chaque donnée, le système peut améliorer la pérennité. De plus, la présence de copies bien placées réduit les temps d'accès. Cependant, cette même existence de plusieurs copies pose des problèmes de cohérence en cas de modification. Ces dernières années, mes contributions ont porté sur ces trois aspects liés à la réplication de données: la pérennité des données, la performance desaccès et la gestion de la cohérence. RelaxDHT et SPLAD permettent d'améliorer la pérennité des données en jouant sur le placement des copies. Caju, AREN et POPS permettent de réduire les temps d'accès aux données en améliorant la localité et en prenant en compte la popularité. Pour accélérer la localisation des copies, DONUT crée des raccourcis efficaces prenant en compte la distribution des données. Enfin, dans le contexte des bases de données répliquées,Gargamel permet de ne paralléliser que les transactions qui sont indépendantes, améliorant ainsi les performances et évitant tout abandon de transaction pour cause de conflit. Ces travaux ont été réalisés avec huit étudiants en thèse dont quatre ont soutenu. Pour l'avenir, je me propose d'étendre ces travaux, d'une part en concevant un système de gestion de données pour les MMOGs, une classe d'application particulièrement exigeante; et, d'autre part, en concevant des mécanismes de gestion de données permettant de n'utiliser que la quantité strictement nécessaire de ressources, en redistribuant dynamiquement les données en fonction des besoins, un pas vers une gestion plus écologique des données

Thèses en Ligne

INRIA a CCSD electronic archive server

Algorithmes passant à l’échelle pour la gestion de données du Web sémantique sur les platformes cloud

Author: Zampetakis Stamatis
Publication venue: HAL CCSD
Publication date: 21/09/2015
Field of study

In order to build smart systems, where machines are able to reason exactly like humans, data with semantics is a major requirement. This need led to the advent of the Semantic Web, proposing standard ways for representing and querying data with semantics. RDF is the prevalent data model used to describe web resources, and SPARQL is the query language that allows expressing queries over RDF data. Being able to store and query data with semantics triggered the development of many RDF data management systems. The rapid evolution of the Semantic Web provoked the shift from centralized data management systems to distributed ones. The first systems to appear relied on P2P and client-server architectures, while recently the focus moved to cloud computing.Cloud computing environments have strongly impacted research and development in distributed software platforms. Cloud providers offer distributed, shared-nothing infrastructures that may be used for data storage and processing. The main features of cloud computing involve scalability, fault-tolerance, and elastic allocation of computing and storage resources following the needs of the users.This thesis investigates the design and implementation of scalable algorithms and systems for cloud-based Semantic Web data management. In particular, we study the performance and cost of exploiting commercial cloud infrastructures to build Semantic Web data repositories, and the optimization of SPARQL queries for massively parallel frameworks.First, we introduce the basic concepts around Semantic Web and the main components and frameworks interacting in massively parallel cloud-based systems. In addition, we provide an extended overview of existing RDF data management systems in the centralized and distributed settings, emphasizing on the critical concepts of storage, indexing, query optimization, and infrastructure. Second, we present AMADA, an architecture for RDF data management using public cloud infrastructures. We follow the Software as a Service (SaaS) model, where the complete platform is running in the cloud and appropriate APIs are provided to the end-users for storing and retrieving RDF data. We explore various storage and querying strategies revealing pros and cons with respect to performance and also to monetary cost, which is a important new dimension to consider in public cloud services. Finally, we present CliqueSquare, a distributed RDF data management system built on top of Hadoop, incorporating a novel optimization algorithm that is able to produce massively parallel plans for SPARQL queries. We present a family of optimization algorithms, relying on n-ary (star) equality joins to build flat plans, and compare their ability to find the flattest possibles. Inspired by existing partitioning and indexing techniques we present a generic storage strategy suitable for storing RDF data in HDFS (Hadoop’s Distributed File System). Our experimental results validate the efficiency and effectiveness of the optimization algorithm demonstrating also the overall performance of the system.Afin de construire des systèmes intelligents, où les machines sont capables de raisonner exactement comme les humains, les données avec sémantique sont une exigence majeure. Ce besoin a conduit à l’apparition du Web sémantique, qui propose des technologies standards pour représenter et interroger les données avec sémantique. RDF est le modèle répandu destiné à décrire de façon formelle les ressources Web, et SPARQL est le langage de requête qui permet de rechercher, d’ajouter, de modifier ou de supprimer des données RDF. Être capable de stocker et de rechercher des données avec sémantique a engendré le développement des nombreux systèmes de gestion des données RDF.L’évolution rapide du Web sémantique a provoqué le passage de systèmes de gestion des données centralisées à ceux distribués. Les premiers systèmes étaient fondés sur les architectures pair-à-pair et client-serveur, alors que récemment l’attention se porte sur le cloud computing.Les environnements de cloud computing ont fortement impacté la recherche et développement dans les systèmes distribués. Les fournisseurs de cloud offrent des infrastructures distribuées autonomes pouvant être utilisées pour le stockage et le traitement des données. Les principales caractéristiques du cloud computing impliquent l’évolutivité́, la tolérance aux pannes et l’allocation élastique des ressources informatiques et de stockage en fonction des besoins des utilisateurs.Cette thèse étudie la conception et la mise en œuvre d’algorithmes et de systèmes passant à l’échelle pour la gestion des données du Web sémantique sur des platformes cloud. Plus particulièrement, nous étudions la performance et le coût d’exploitation des services de cloud computing pour construire des entrepôts de données du Web sémantique, ainsi que l’optimisation de requêtes SPARQL pour les cadres massivement parallèles.Tout d’abord, nous introduisons les concepts de base concernant le Web sémantique et les principaux composants des systèmes fondés sur le cloud. En outre, nous présentons un aperçu des systèmes de gestion des données RDF (centralisés et distribués), en mettant l’accent sur les concepts critiques de stockage, d’indexation, d’optimisation des requêtes et d’infrastructure.Ensuite, nous présentons AMADA, une architecture de gestion de données RDF utilisant les infrastructures de cloud public. Nous adoptons le modèle de logiciel en tant que service (software as a service - SaaS), où la plateforme réside dans le cloud et des APIs appropriées sont mises à disposition des utilisateurs, afin qu’ils soient capables de stocker et de récupérer des données RDF. Nous explorons diverses stratégies de stockage et d’interrogation, et nous étudions leurs avantages et inconvénients au regard de la performance et du coût monétaire, qui est une nouvelle dimension importante à considérer dans les services de cloud public.Enfin, nous présentons CliqueSquare, un système distribué de gestion des données RDF basé sur Hadoop. CliqueSquare intègre un nouvel algorithme d’optimisation qui est capable de produire des plans massivement parallèles pour des requêtes SPARQL. Nous présentons une famille d’algorithmes d’optimisation, s’appuyant sur les équijointures n- aires pour générer des plans plats, et nous comparons leur capacité à trouver les plans les plus plats possibles. Inspirés par des techniques de partitionnement et d’indexation existantes, nous présentons une stratégie de stockage générique appropriée au stockage de données RDF dans HDFS (Hadoop Distributed File System). Nos résultats expérimentaux valident l’effectivité et l’efficacité de l’algorithme d’optimisation démontrant également la performance globale du système

HAL-CentraleSupelec

Thèses en Ligne

INRIA a CCSD electronic archive server

Theses.fr

HAL-Rennes 1

Méthodologie d'évaluation de STEP pour sa mise en place

Author: Caron Marie-Christine
Publication venue
Publication date: 01/01/1998
Field of study

Échange de données -- Normes existantes -- Généralités sur STEP -- Tests de conformité -- Mapping -- Problématique dans une entreprise -- Expériences faites avec STEP -- Méthodologie d'évaluation de STEP pour sa mise en place -- Pertinence de la méthodologie -- Procédure méthodologique -- Définition des objectifs et du domaine d'échange (A1) -- Traduction et réception des fichiers d'étude de cas (A2) -- Vérification des fichiers (A3) -- Vers une procédure d'analyse -- Description des tests et analyse de la méthodologie -- Procédure d'analyse de la méthodologie -- Présentation des tests -- Analyse de la méthodologie

PolyPublie

Sémantique et Internet des objets : d'un état de l'art à une ontologie modulaire

Author: Ben Alaya Mahdi
Haemmerlé Ollivier
Hernandez Nathalie,
Monteil Thierry
Seydoux Nicolas
Publication venue: HAL CCSD
Publication date: 01/01/2015
Field of study

National audienceLa notion d'Internet des Objets désigne un réseau d'objets connectés entre eux et communiquant de manière automatique. Les notions de sémantiques y ont une place croissante, car plus que jamais elles ap-paraissent comme une solution aux problèmes d'interopérabilité et d'interprétation des données et des services par des machines. La diversité des applications possibles à l'intersection de l'internet des objets et du web sé-mantique a poussé de nombreuses équipes de recherche à travailler à l'interface entre ces deux disciplines. Nous souhaitons dans ce papier faire un inventaire de leurs propositions. Nous cherchons également à contribuer à l'évolution de ce domaine de recherche en proposant une ontologie pour décrire les réseaux d'objets connectés

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

HAL-INSA Toulouse

SéMo'07 : premier atelier sur la Sémantique des Modèles

Author: Combemale Benoit
Crégut Xavier
Michel Pierre
Pantel Marc
Publication venue: 'Lavoisier'
Publication date: 01/01/2007
Field of study

International audienceThis paper summarises the presentations and exchanges that took place in the SéMo'2007 workshop in March 2007 in Toulouse during the IDM conference. The main topic of the workshop was the semantics of models and meta-models in the purpose to confront the MDE users needs and the technologies used for specification and programming languages

Crossref

Scientific Publications of the University of Toulouse II Le Mirail

HAL Descartes

Évaluation de la qualité des données géospatiales : approche top-down et gestion de la métaqualité

Author: Lévesque Johann
Publication venue: Bibliotheque de l' Universite Laval
Publication date: 01/01/2007
Field of study

Depuis l'avènement du numérique, la demande de données par les utilisateurs des systèmes d'information géographique (SIG) ne fait qu'augmenter. Les organismes utilisateurs se retrouvent souvent devant plusieurs sources de données géographiques potentielles et ils doivent alors évaluer la qualité de chaque source en fonction de leurs besoins. Pour ce faire, ces organismes pourraient faire appel à un expert en qualité qui pourrait les aider à déterminer s'il y a adéquation (i.e. qualité externe) entre les données et leurs besoins. Pour utiliser le système MUM, l'expert en qualité doit recueillir de l'information sur les jeux de données. Dans le domaine de la géomatique, cette information se retrouve généralement sous la forme de métadonnées émises par les producteurs de données. Le système MUM, développé par Devillers et al. [2004b], a été conçu initialement en fonction d'une approche bottom-up, où on utilise des métadonnées fines pour extraire des indicateurs globaux de qualité, à l'aide d'opérateurs d'agrégation typiques des outils SOLAP. Il s'agit là d'une solution qui permet de faciliter l'analyse de la qualité, particulièrement dans des contextes de données hétérogènes. Par contre, comme le mentionnent les concepteurs de MUM, le manque de métadonnées fines est un obstacle à l'utilisation du système MUM dans sa forme actuelle. L'objectif de la présente recherche a donc été d'élaborer une méthode de génération des métadonnées dite top-down. Cette méthode permet de générer, lorsque possible, les métadonnées fines (au niveau des occurrences, voire des primitives géométriques) d'un jeu de données à l'aide des métadonnées grossières et des opinions d'experts touchant un ensemble d'occurrences. Cette méthodologie amène l'expert en qualité à utiliser dans certains cas des sources de données différentes. Ceci soulève alors un problème concernant l'hétérogénéité de la fiabilité des sources utilisées pour évaluer la qualité externe. Le concept de métaqualité a été introduit pour répondre à ce problème d'hétérogénéité. Il permet en effet de quantifier le risque lié à l'imperfection de l'information contenue dans les indicateurs de qualité. L'enrichissement du système MUM a donc été réalisé grâce à la conception du modèle E-QIMM (Extented Quality Information Management Model) qui est une extension du modèle QIMM de Devillers [2004] et qui permet d'intégrer la dimension ± Métaqualité ¿ dans le processus d'évaluation de la qualité

CorpusUL

La philosophie de la technologie blockchain - Ontologies

Author: Sfetcu Nicolae
Publication venue
Publication date: 14/12/2019
Field of study

De la nécessité et de l'utilité de développer une philosophie spécifique pour la technologie de la blockchain, mettant l'accent sur les aspects ontologiques. Après une Introduction qui met en évidence les principales orientations philosophiques de cette technologie émergente, dans La technologie blockchain j’explique le fonctionnement de la blockchain, en analysant les directions de développement ontologique de cette technologie dans Conception et modélisation. La section suivante est consacrée à la principale application de la technologie de la blockchain, Bitcoin, avec les implications sociales de cette crypto-monnaie. Il suit une section de Philosophie dans laquelle j'identifie la technologie de la blockchain au concept d'hétérotopie développé par Michel Foucault et je l'interprète à la lumière de la technologie de notation développée par Nelson Goodman en tant que système de notation. Dans la section Ontologie, je présente deux voies de développement que j'estime importantes: une Ontologie narrative, basée sur l'idée d'ordre et de structure de l'histoire transmise à travers l'histoire narrative de Paul Ricoeur, et le système de l'Ontologie d'entreprise basé sur des concepts et des modèles d'entreprise, spécifiques au Web sémantique, que je considère comme le plus développé et qui deviendra probablement le système ontologique formel, du moins en ce qui concerne les aspects économiques et juridiques de la technologie de la blockchain. Dans Conclusions, je parle des orientations futures du développement de la philosophie de la technologie blockchain en général en tant que théorie explicative et robuste d’un point de vue phénoménologique cohérent, qui permet la testabilité et les ontologies en particulier, en plaidant pour la nécessité de l’adoption globale d’un système ontologique afin de développer des solutions transversales et de rentabiliser cette technologie. SOMMAIRE: Abstract Introduction La technologie blockchain - Conception - Modèles Bitcoin Philosophie Ontologies - Ontologies narratives - Ontologies d'entreprise Conclusions Bibliographie Notes DOI: 10.13140/RG.2.2.22996.1472

PhilPapers

E-LIS

Fédération multi-sources en neurosciences : intégration de données relationnelles et sémantiques

Author: Corby Olivier
Faron Zucker Catherine
Gaignard Alban
Montagnat Johan
Publication venue: HAL CCSD
Publication date: 01/06/2012
Field of study

National audienceLa fédération et l'interrogation multi-sources de données est un besoin croissant. En neurosciences collaboratives, les entrepôts de données sont hétérogènes et ne peuvent être relocalisés hors des sites d'origine, pour des raisons historiques, juridiques ou éthiques. Cet article présente un système de recherche d'informations qui s'interface à des entrepôts de données multiples, hétérogènes et distribués. Ce système est évalué dans le cadre d'une plateforme de neurosciences collaboratives dédiée aux études cliniques multi-centriques en termes d'utilisabilité et de performance

HAL-UNICE

INRIA a CCSD electronic archive server

Co-analyse schéma-données-programmes en rétro-ingénierie des bases de données

Author: Folisi Piero
Publication venue
Publication date: 01/01/2009
Field of study

Repository of the University of Namur