100 research outputs found

    Agrégation des résultats dans les systèmes de recherche d’information pair-à-pair non structurés

    Get PDF
    A huge part of the impetus of various internet technologies through the Peer-to-Peer (Peer-to-Peer or P2P) system can be seen as a reaction to the content centering detriment on the servers in front of passive clients. One of the distinctive features of any P2P system is what we often call direct connectivity between equal peers. The Peer-to-Peer increased the exchange flows between dynamic communities of users which tend to grow rapidly. We talk, therefore, about large-scale distributed systems in which the exchanged, shared and sought information reaches a more and more impressive volumes. Solving the aggregation problem in P2PIR systems the same way as its resolution in Distributed Information Retrieval (DIR) will miss a lot of intelligibility. In fact, the context has changed in RIP2P, given the scale factor and the lack of a global vision of the system in these networks that extend naturally to thousands or even millions peers. This will involve the removal of a broker server that is inadequate in this context and will raise the problem of finding new policies to aggregate results coming from heterogeneous peers in a single list while reflecting the user’s expectations. All these reasons prompted us to explore an aggregation mechanism based on user profiles deduced from their past behavior due to their interaction with query results. Our contributions, in this thesis, focus on two complementary axes. First, we propose a new vision of results aggregation in a large scale system. In this context, a profiles model and a hybrid score profiles-based approach are proposed. Second, we focused on the development of an evaluation framework of our approach in large-scale systems. In this thesis, we are mainly interested in the Information Retrieval problem in P2P systems (P2PIR) and focusing more specifically on the problem of results’ aggregation in such systemsUne grande partie de l’impulsion de diverses technologies d’Internet par les systèmes Pair-à-Pair (Peer-to-Peer ou P2P) peut être vue comme une réaction au détriment du centrage de contenu sur les serveurs devant des clients passifs. Une des caractéristiques distinctives de tout système P2P est ce que nous appelons souvent connectivité directe de bout en bout entre pairs égaux. Le Pair-à-Pair a augmenté les débits des échanges entre des communautés dynamiques des utilisateurs qui tendent à augmenter rapidement. Nous parlons donc de systèmes distribués à large échelle dans lesquels l’information échangée, partagée et recherchée atteint des volumes de plus en plus impressionnants. Dans le cadre de cette thèse, nous nous intéressons essentiellement à la Recherche d'Information dans les systèmes de Recherche d’Information P2P (RIP2P) et plus précisément au problème d'agrégation des résultats dans de tels systèmes. Résoudre le problème d'agrégation en RIP2P de la même manière que sa résolution dans un cadre de Recherche d’Information Distribuée (RID) va manquer beaucoup d’intelligibilité. En effet, ça fait perdre de vue tout un contexte qui a changé en RIP2P, vu le facteur d'échelle et l’absence d’une vision globale sur le système, dans ces réseaux qui s'étendent naturellement à des milliers voire des millions de pairs. Ceci va impliquer notamment la suppression d'un serveur courtier inadéquat dans ce contexte et va soulever le problème de retrouver de nouvelles politiques pour agréger des résultats provenant de pairs hétérogènes dans une liste unique tout en reflétant les attentes de l'utilisateur. Toutes ces raisons nous ont incités à explorer un mécanisme d’agrégation basé sur les profils des utilisateurs déduits de leurs comportements passés suite à leurs interactions avec les résultats d’une requête. Dans cette thèse nos contributions portent sur deux axes complémentaires. D’abord, nous proposons une nouvelle vision d'agrégation de résultats dans un contexte large échelle. Dans ce cadre un modèle de profils et une approche de score hybride à base de profils sont proposés. Ensuite nous avons mis l’accent sur la mise en place d’un cadre d'évaluation de notre approche dans les systèmes à large échell

    Localisation de sources de données et optimisation de requêtes réparties en environnement pair-à-pair

    Get PDF
    Malgré leur succès dans le domaine du partage de fichiers, les systèmes P2P sont capables d'évaluer uniquement des requêtes simples basées sur la recherche d'un fichier en utilisant son nom. Récemment, plusieurs travaux de recherche sont effectués afin d'étendre ces systèmes pour qu'ils permettent le partage de données avec une granularité fine (i.e. un attribut atomique) et l'évaluation de requêtes complexes (i.e. requêtes SQL). A cause des caractéristiques des systèmes P2P (e.g. grande-échelle, instabilité et autonomie de nœuds), il n'est pas pratique d'avoir un catalogue global qui contient souvent des informations sur: les schémas, les données et les hôtes des sources de données. L'absence d'un catalogue global rend plus difficiles: (i) la localisation de sources de données en prenant en compte l'hétérogénéité de schémas et (ii) l'optimisation de requêtes. Dans notre thèse, nous proposons une approche pour l'évaluation des requêtes SQL en environnement P2P. Notre approche est fondée sur une ontologie de domaine et sur des formules de similarité pour résoudre l'hétérogénéité sémantique des schémas locaux. Quant à l'hétérogénéité structurelle de ces schémas, elle est résolue grâce à l'extension d'un algorithme de routage de requêtes (i.e. le protocole Chord) par des Indexes de structure. Concernant l'optimisation de requêtes, nous proposons de profiter de la phase de localisation de sources de données pour obtenir toutes les méta-données nécessaires pour générer un plan d'exécution proche de l'optimal. Afin de montrer la faisabilité et la validité de nos propositions, nous effectuons une évaluation des performances et nous discutons les résultats obtenus.Despite of their great success in the file sharing domain, P2P systems support only simple queries usually based on looking up a file by using its name. Recently, several research works have made to extend P2P systems to be able to share data having a fine granularity (i.e. atomic attribute) and to process queries written with a highly expressive language (i.e. SQL). The characteristics of P2P systems (e.g. large-scale, node autonomy and instability) make impractical to have a global catalog that stores often information about data, schemas and data source hosts. Because of the absence of a global catalog, two problems become more difficult: (i) locating data sources with taking into account the schema heterogeneity and (ii) query optimization. In our thesis, we propose an approach for processing SQL queries in a P2P environment. To solve the semantic heterogeneity between local schemas, our approach is based on domain ontology and on similarity formulas. As for the structural heterogeneity of local schemas, it is solved by the extension of a query routing method (i.e. Chord protocol) with Structure Indexes. Concerning the query optimization problem, we propose to take advantage of the data source localization phase to obtain all metadata required for generating a close to optimal execution plan. Finally, in order to show the feasibility and the validity of our propositions, we carry out performance evaluations and we discuss the obtained results

    Vers une plateforme holistique de protection de la vie privée dans les services géodépendants

    Full text link
    Les services géodépendants (LBS : Location-Based Services) sont présents dans la plupart de nos activités quotidiennes, ils représentent l’ensemble des services en ligne qui fournissent des informations basées sur la géolocalisation des individus. On peut les retrouver dans plusieurs domaines tels que les soins médicaux, le divertissement, le transport, et de nombreuses autres activités. En outre, avec leur présence dans presque toutes les tâches quotidiennes, leur utilité ne peut être négligée, ainsi que leur impact sur la façon dont les données des individus sont traitées n’est plus la même. De plus, avec la croissance du nombre de propriétaires de dispositifs mobiles, il est devenu plus facile de localiser un individu, rendant ainsi presque inévitables les problèmes liés à la confidentialité. Par conséquent, des solutions plus sévères sont fortement nécessaires afin de gérer les problèmes de confidentialité et de conserver l’utilité de LBS. Nous présentons dans cette thèse une recherche qui porte sur la protection de la vie privée des utilisateurs dans un LBS tout en gardant un maximum d’utilité des services. Autre que l’état de l’art et les fondements théoriques, ce travail est divisé en trois parties principales, chacune d’elles décrit un ensemble des composants connexes de la plateforme proposée, nommée Deloc. En conclusion, nous proposons une plateforme collaborative de protection de la confidentialité des utilisateurs LBS, qui est à la fois efficace, performante, et qui surtout n’affecte pas l’utilité estimée de l’utilisation d’un LBS donné.Location-Based Services (LBS) are present in most of our daily activities, and they repre sent all online services used to provide information based on the location of individuals. These services can be found in several fields such as healthcare, entertainment, transportation, and many other daily activities. Besides, along with their presence in almost all daily tasks, their utility cannot be ignored, and as a result, their impact on how individuals’ data are processed is no longer the same. With smartphone ownership growth, it has become easier to locate an individual, and privacy issues have become almost inescapable. Hence, more severe solutions are strongly required to handle privacy issues while keeping the utility of LBS. We present in this thesis a research work about protecting the privacy of users in an LBS while keeping maximum utility of the service. In addition to the state of the art and the theoretical background, this work is divided into three main parts when each one describes a set of related components of the proposed framework, called Deloc. We present in this thesis a research into about privacy protection in LBSs while maintaining the maximum utility of these services. In addition to the state of the art and the theoretical background, this work is divided into three main parts, where each one describes a set of related components of the proposed framework named Deloc. • Delegation concept. We propose in this part the main concept behind this re search. The goal is to propose a collaborative mechanism where each user participates in the protection of other users without the need for transforming his geographical coordinates, nor losing the utility of the service. We also evaluate the concept on data issued from real-world users in a finely simulated environment with tuneable parameters, and we demonstrate its high guarantees of privacy, efficiency, and utility facing most of the current LBS applications. • Quantification of risks and trust. This part is based on the fact that the dependence of delegation concept on the LBS users may imply privacy issues. This part of the paper discusses two models of quantification and measurement of risks and trust in the context of LBS. First, we propose a model based on the theory of mutual information that is used to assess the risks associated with the use of the delegation concept. Then we discuss a model based on Markov chains that helps to estimate the level of trust for each of the collaborators. We also discuss the applicability of both models and their theoretical and empirical validation. • Privacy Metric for Collaborative Systems. The lack of a metric designed for collaborative systems is the main motivation behind this part. We discuss our proposal for a privacy metric based on the theory of fuzzy sets. We propose three models that each one of them deals with a subset of Delocprivacy requirements. The attacker, the privacy, and the utility model are the three models used to define the privacy metric named d-fuzziness. We also discuss the validation of the metric, and its measurement efficiency in the case of collaborative mechanisms, especially Deloc. In conclusion, we propose a collaborative location privacy-preserving framework, which is at the same time efficient, powerful, and which does not affect the estimated utility of using LBSs

    Contributions à la recherche d'information dans des systèmes distribués, ouverts, intégrant des participants autonomes

    Get PDF
    Les travaux que nous présentons sont relatifs à la problématique de la recherche d'information dans des systèmes dont les traits caractéristiques sont la distribution à très large échelle, l'ouverture, et l'autonomie des participants. Nous nous sommes plus particulièrement intéressé à des solutions facilitant l'intégration des participants et s'adaptant dynamiquement à leurs attentes. Nos travaux s'articulent au tour de trois axes : la définition d'une architecture distribuée, l'allocation de requêtes, et le traitement de l'hétérogénéité sémantique. Nous avons d'abord proposé une architecture totalement distribuée organisée en communautés thématiques. Cette vision sémantique de l'organisation, combinée à une politique qui consiste à s'appuyer non seulement sur les ressource des participants, mais aussi sur leurs compétences, permet de router les requêtes et les réponses dans le système en évitant de maintenir d'un index général tel que pratiqué par les moteurs de recherche. Un système ainsi distribué pose rapidement le problème de l'allocation des requêtes. En effet, tous les fournisseurs d'information ne disposent pas de ressources leur permettant de traiter le très grand nombre de requêtes émises. Laisser les participants choisir les requêtes qu'ils traitent répond aux attentes des fournisseurs. Cependant, cela entraine que certaines requêtes ne sont pas traitées pour des raisons individuelles, ce qui ne correspond pas au comportement qu'attendent les utilisateurs. Nous avons donc exploré la piste consistant à tenir compte des intentions des participants tout en allouant autoritairement les requêtes si nécessaire. Nous avons d'abord proposé une médiation flexible utilisant des aspects monétaires. Puis, nous avons mené une étude concernant la satisfaction des participants où nous avons dégagé un certain nombre de notions : satisfaction, satisfaction par rapport au système d'allocation, adéquation d'un participant par rapport au système, adéquation du système par rapport à un participant, etc. Nous avons alors proposé une deuxième technique d'allocation, SbQA, directement basée sur la notion de satisfaction. Enfin, de par leur nature, les systèmes distribués ouverts intègrent des participants provenant d'horizons différents ce qui est propice à l'hétérogénéité sémantique. Dans le cadre de la recherche d'information et des vecteurs sémantiques, nous avons proposé une méthode qui utilise non seulement les alignements entre ontologies mais aussi un mécanisme «d'explication» et «d'interprétation» pour améliorer l'interopérabilité sémantique

    Architecture autonome et distribuée d'adressage et de routage pour la flexibilité des communications dans l'internet

    Get PDF
    Les schémas de routage locaux basés sur des coordonnées prises dans le plan hyperbolique ont attiré un intérêt croissant depuis quelques années. Cependant, les solutions proposées sont toutes appliquées à des réseaux au topologie aléatoire et au nombre de nœuds limités. Dans le même temps, plusieurs travaux se sont concentrés sur la création de modèle topologique basé sur les lois de la géométrie hyperbolique. Dans ce cas, Il est montré que les graphes ont des topologies semblables à Internet et qu'un routage local hyperbolique atteint une efficacité proche de la perfection. Cependant, ces graphes ne garantissent pas le taux de réussite du routage même si aucune panne ne se produit. Dans cette thèse, l'objectif est de construire un système passant à l'échelle pour la création de réseau recouvrant capable de fournir à ses membres un service d'adressage et de routage résilient dans un environnement dynamique. Ensuite, nous étudions de quelle manière les réseaux P2PTV pourraient supporter un nombre d'utilisateur croissant. Dans cette thèse, nous essayons de répondre à cette question en étudiant les facteurs d'efficacité et de passage à l'échelle dans un système de diffusion vidéo P2P typique. Au travers des données fournies par Zattoo, producteur de réseau P2PTV, nous réalisons des simulations dont les résultats montrent qu'il y a encore des obstacles à surmonter avant que les réseaux P2P de diffusion vidéo puissent dépendre uniquement de leurs utilisateurs.Local routing schemes based on virtual coordinates taken from the hyperbolic plane have attracted considerable interest in recent years.However, solutions have been applied to ad-hoc and sensor networks having a random topology and a limited number of nodes. In other hand, some research has focused on the creation of network topology models based on hyperbolic geometric laws. In this case, it has been shown that these graphs have an Internet-like topology and that local hyperbolic routing achieves a near perfect efficiency. However, with these graphs, routing success is not guaranteed even if no failures happen. In this thesis, we aim at building a scalable system for creating overlay networks on top of the Internet that would provide reliable addressing and routing service to its members in a dynamic environment.Next, we investigate how well P2PTV networks would support a growing number of users. In this thesis, we try to address this question by studying scalability and efficiency factors in a typical P2P based live streaming network. Through the use of the data provided by Zattoo a production P2PTV network, we carry out simulations whose results show that there are still hurdles to overcome before P2P based live streaming could depend uniquely of their users.BORDEAUX1-Bib.electronique (335229901) / SudocSudocFranceF

    Architecture autonome et distribuée d'adressage et de routage pour la flexibilité des communications dans l'Internet

    Get PDF
    Local routing schemes based on virtual coordinates taken from the hyperbolic plane have attracted considerable interest in recent years. However, solutions have been applied to ad-hoc and sensor networks having a random topology and a limited number of nodes. In other hand, some research has focused on the creation of network topology models basedon hyperbolic geometric laws. In this case, it has been shown that these graphs have an Internet-like topology and that local hyperbolic routing achieves a near perfect efficiency. However, with these graphs, routing success is not guaranteed even if no failures happen. In this thesis, we aim at building a scalable system for creating overlay networks on top ofthe Internet that would provide reliable addressing and routing service to its members in a dynamic environment. Next, we investigate how well P2PTV networks would support a growing number of users. In this thesis, we try to address this question by studying scalability and efficiency factors in a typical P2P based live streaming network. Throughthe use of the data provided by Zattoo a production P2PTV network, we carry out simulations whose results show that there are still hurdles to overcome before P2P based live streaming could depend uniquely of their users.Les schémas de routage locaux basés sur des coordonnées prises dans le plan hyperbolique ont attiré un intérêt croissant depuis quelques années. Cependant, les solutions proposées sont toutes appliquées à des réseaux aux topologies aléatoires et au nombre de noeuds limité. Dans le même temps, plusieurs travaux se sont concentrés sur la création de modèle topologique basé sur les lois de la géométrie hyperbolique. Dans ce cas, Il est montré que les graphes ont des topologies semblables à Internet et qu’un routage local hyperbolique atteint une efficacité proche de la perfection. Cependant, ces graphes ne garantissent pas le taux de réussite du routage même si aucune panne ne se produit. Dans cette thèse, l’objectif est de construire un système passant à l’échelle pour la création de réseau recouvrant capable de fournir à ses membres un service d’adressage et de routage résilient dans un environnement dynamique. Ensuite, nous étudions de quelle manière les réseaux P2PTV pourraient supporter un nombre d’utilisateur croissant. Dans cette thèse, nous essayons de répondre à cette question en étudiant les facteurs de l’efficacité et du passage à l’échelle dans un système de diffusion vidéo P2P typique. Au travers des données fournies par Zattoo, producteur de réseau P2PTV, nous réalisons des simulations dont les résultats montrent qu’il y a encore des obstacles à surmonter avant que les réseaux P2P de diffusion vidéo puissent dépendre uniquement de leurs utilisateurs

    Vérification automatique de la confidentialité différentielle

    Get PDF
    Ce rapport étudie la vérification quantitative de la confidentialité différentielle dans les systèmes distribués. Tout d’abord, nous examinons l’applicabilité de la vérification des modèles probabilistes pour fournir des garanties sur le comportement des système différentiellement confidentiels. Ensuite, nous concevons des méthodes qui extraient automatiquement les modèles des systèmes à partir d’une description de haut niveau, puis nous effectuons une vérification probabiliste de ces modèles. Nous développons à cette fin une nouvelle méthodologie de la vérification quantitative. Nous décrivons des méthodes formelles pour analyser un large éventail de propriétés de confidentialité, notamment la précision et la perte de la confidentialité. Nous avons également réexprimé la notion de confidentialité différentielle pour raisonner sur deux exécutions de programmes similaires. À notre connaissance, il s’agit des analyses de confidentialité les plus genérales pour les systèmes distribués. Deuxièmement, nous fournissons des preuves de couplage basées sur les relations de levage approximatives pour prouver la confidentialité différentielle dans les chaînes de Markov. Nous proposons également des algorithmes de vérification symbolique de la confidentialité. L’avantage de notre approche est que ces algorithmes peuvent être facilement implémentés dans n’importe quel outil de vérification de modèles probabilistes. Enfin, nous définissons une approche pour extraie des contre-exemples qui peuvent être utilisés pour fin de débogage similaires en fournissant une exécution qui viole la confidentialité.----------ABSTRACT: This report studies the quantitative verification of differential privacy in distributed systems. First, we examine the applicability of probabilistic model checking to provide guarantees on the behavior of differentially private systems. Next, we design methods that automatically extract the models of the systems from a high-level description, then we perform a probabilistic verification of these models. To this end, we are developing a new methodology for quantitative verification. We describe formal methods for analyzing a wide range of privacy properties, including accuracy and privacy loss. We have also re-expressed the notion of differential privacy to reason about two executions of similar programs. To our knowledge, this is the most general privacy analysis for distributed systems. Second, we provide evidence of coupling based on approximate lifting relationships to prove differential privacy in Markov chains. We also offer symbolic algorithm for verification of confidentiality. The advantage of our approach is that these algorithms can be easily implemented in any probabilistic model checker tool. Finally, we define an approach for extracting counterexamples that can be used for similar debugging purposes by providing an execution that violates confidentiality

    Systèmes interactifs auto-adaptatifs par systèmes multi-agents auto-organisateurs : application à la personnalisation de l'accès à l'information

    Get PDF
    Les réseaux de systèmes d'information tendent à devenir de plus en plus complexes en raison de leur hétérogénéité, de leur dynamique et de leur croissance permanente. Afin de gérer cette complexité et ces problèmes de surcharge informationnelle, les moteurs de recherche actuels s'appuient sur la notion de profil usager qui représente les centres d'intérêts, les préférences et les besoins d'un individu. Or, ces techniques dérivées de la recherche d'information et de l'apprentissage artificiel ne proposent pas de solution réellement adaptative pour la prise en compte de l'aspect évolutif du profil et le respect de la vie privée de l'utilisateur. Nous proposons d'exploiter le paradigme des systèmes multi-agents, et plus spécifiquement l'approche par AMAS (Adaptive Multi-Agent System), pour apporter une solution distribuée à la personnalisation et à l'adaptation des services offerts aux utilisateurs. Nos contributions portent tout d'abord sur l'évaluation adaptative et personnalisée du feedback implicite de l'utilisateur, puis sur la construction adaptative de son profil à partir de documents textuels représentant ses intérêts. Elles proposent également une plateforme nommée SWAPP dédiée à la recherche d'information personnalisée sur le Web. Ce cadre applicatif a permis d'expérimenter nos deux premières contributions individuellement, puis conjointement. Cette évaluation simultanée a mis en évidence un nouveau problème théorique : le couplage de deux AMAS conçus de manière totalement indépendante. Ce travail propose ainsi une première approche pour la conception de systèmes de systèmes auto-adaptatifs.Networks of information systems are becoming more and more complex due to their heterogeneity, their dynamics and their continuous growing. In order to cope with this information overload and this complexity, nowadays search engines make use of the notion of user profile that aim to model main interests, preferences and user's needs. Nevertheless, these techniques, derived from information retrieval and artificial learning research field, does not represent truly adaptive solutions able to cope with user profiles evolutions and to ensure user's privacy. Faced to these challenges, we propose to use the multi-agent system paradigm, and more specifically the AMAS approach (Adaptive Multi-Agent System), in order to provide a distributed solution for the personalisation and the adaptation of services and information access. Our first contribution consists in the adaptive and personalised evaluation of user implicit feedback. The second contribution studies the adaptive modelling of user profile from textual documents that represents its interests. We also propose the SWAPP platform which is dedicated to the evaluation of our approach to the web personalised information retrieval. After the individual experimentation and validation of these two first contributions within this applicative framework, they have been evaluated together. This last evaluation underlined a new theoretical problem : the coupling of two AMAS that were independently designed. Thus, this study proposes a first approach for the design of systems of self-adaptive systems

    Agents mobiles coopérants pour les environnements dynamiques

    Get PDF
    A partir de l'étude de la mobilité dans les paradigmes de programmation pour les systèmes distribués et des différents architectures réseaux, et principalement celles sans-fils, nous avons pu identifier le problème de la gestion des unités mobiles (PDA, smartphone, ...) lorsque l'on souhaite les intégrer dans Internet. Leurs déplacements introduisent un fort dynamisme matériel qui ne permet plus d'utiliser les techniques classiques d'un internet et d'obtenir un système gérant globalement la localisation de toutes les unités. Cette absence de gestion globale remet en cause les méthodes classiques de conception fondées sur un système offrant une représentation stable de l'environnements. Dans ce contexte, nous avons étudié la conception basée sur les agents mobiles, programmes se déplaçant de site en site de manière autonome, afin de démontrer leur utilité dans des environnements dynamiques à l'échelle d'Internet, et ce, en l'absence d'un système capable de gérer la localisation globale. ABSTRACT : From the study of programming paradigms used in distributed systems and recent network architectures, especially wireless ones, we distinguish the problem of mobile unit management (PDA, smartphone, ...) when they are involved in the Internet. Their mobility introduces a high physical dynamism which leads to reconsider design patterns used in an intranet. Such systems do not allow to provide a global view of the distribution. This absence of global view implies to revisit classical design approaches based upon a system supplying a stable context representation. Therefore, we have studied a design approach based upon mobile agents, namely programs moving from site to site in an autonomous way. We demonstrate their usefulness in such dynamic environments at large scale in the Internet, in which there exits non global location service
    • …
    corecore