81 research outputs found

    Impact de la structure des documents XML sur le processus d'appariement dans le contexte de la recherche d'information semi-structurée

    Get PDF
    Nos travaux s'inscrivent dans le cadre de la recherche d'information sur documents semi-structurĂ©sde type XML. La recherche d'information structurĂ©e (RIS) a pour objectif de retourner des granules documentaires prĂ©cis rĂ©pondant aux besoins d'information exprimĂ©s par l'utilisateur au travers de requĂȘtes. Ces requĂȘtes permettent de spĂ©cifier, en plus des conditions de contenu, des contraintes structurelles sur la localisation de l'information recherchĂ©e. L'objectif de nos travaux est d'Ă©tudier l'apport de la structure des documents dans le processus d'appariement documents-requĂȘtes. Puisque les contraintes structurelles des requĂȘtes peuvent ĂȘtre reprĂ©sentĂ©es sous la forme d'un arbre et que, parallĂšlement, la structure du document, de nature hiĂ©rarchique, peut elle-mĂȘme utiliser le mĂȘme type de reprĂ©sentation, nous avons proposĂ© plusieurs modĂšles de mesure de la similaritĂ© entre ces deux structures. La mesure de la similaritĂ© entre deux structures arborescentes ayant Ă©tĂ© Ă©tudiĂ©e par le domaine de la thĂ©orie des graphes, nous avons tout d'abord cherchĂ© Ă  adapter les algorithmes de ce domaine Ă  notre problĂ©matique. Suite Ă  une Ă©tude approfondie de ces algorithmes au regard de la RIS, notre choix s'est portĂ© sur la distance d'Ă©dition entre arbres (Tree Edit Distance - TED). Cet algorithme permet, au travers de l'application rĂ©cursive de sĂ©quences de suppression et de substitution, de mesurer le degrĂ© d'isomorphisme (le degrĂ© de similaritĂ©) entre deux arbres. Constatant que ces algorithmes sont coĂ»teux en mĂ©moire et en calcul, nous avons cherchĂ© Ă  en rĂ©duire la complexitĂ© et le temps d'exĂ©cution au travers d'approches de rĂ©sumĂ© et de la mise en place d'un algorithme de TED au coĂ»t de complexitĂ© plus bas. Etant donnĂ© que la TED est normalement utilisĂ©e avec des coĂ»ts d'opĂ©ration fixes peut adaptĂ©s Ă  notre problĂ©matique, nous en avons Ă©galement proposĂ© de nouveaux basĂ©s sur la distance dans le graphe formĂ© par la grammaire des documents : la DTD. Notre deuxiĂšme proposition se base sur les ModĂšles de Langue. En recherche d'information, ces derniers sont utilisĂ©s afin de mesurer la pertinence au travers de la probabilitĂ© qu'un terme de la requĂȘte soit gĂ©nĂ©rĂ© par un document. Nous avons utilisĂ©s les ModĂšles de Langue pour mesurer, non pas la probabilitĂ© de pertinence du contenu, mais celle de la structure. Afin de former un vocabulaire document et requĂȘte Ă  mĂȘme d'ĂȘtre utilisĂ© par notre modĂšle de langue structurel nous avons utilisĂ© une technique de relaxation pondĂ©rĂ©e (la relaxation est le relĂąchement des contraintes). Nous avons Ă©galement proposĂ© une mĂ©thode pour apparier le contenu des documents et celui des requĂȘtes. L'appariement seul des structures Ă©tant insuffisant dans une problĂ©matique de recherche d'information : la pertinence d'un granule documentaire est jugĂ©e en prioritĂ© sur la pertinence de l'information textuelle qu'il contient. De ce fait, nous avons proposĂ© une approche de mesure de la pertinence de ce contenu. Notre mĂ©thode utilise la structure de l'arbre afin d'opĂ©rer une propagation de la pertinence du texte en prenant en compte l'environnement des Ă©lĂ©ments traversĂ©s ainsi que le contexte global du document. Nos diffĂ©rents modĂšles ont Ă©tĂ© expĂ©rimentĂ©s sur deux tĂąches de la campagne d'Ă©valuation de rĂ©fĂ©rence de notre domaine : Initiative for XML Retrieval. Cette campagne a pour but de permettre l'Ă©valuation de systĂšmes de recherche d'information XML dans un cadre normalisĂ©e et comporte plusieurs tĂąches fournissant des corpus, des mesures d'Ă©valuation, des requĂȘtes, et des jugements de pertinence. Nous avons Ă  ce propos participĂ© Ă  cette campagne en 2011.Pour nos expĂ©rimentations, les tĂąches que nous avons choisi d'utiliser sont : * La tĂąche SSCAS d'INEX 2005 qui utilise une collection d'articles scientifiques d'IEEE. Cette collection est orientĂ©e texte dans la mesure oĂč la structure exprimĂ©e dans les documents qu'elle contient est similaire Ă  celle d'un livre (paragraphe, sections). * La tĂąche Datacentric d'INEX 2010 dont la collection est extraite d'IMDB. Cette collection est orientĂ©e donnĂ©es dans la mesure oĂč les termes des documents sont trĂšs spĂ©cifiques et peu redondants et que la structure est porteuse de sens. Nos diffĂ©rentes expĂ©rimentations nous ont permis de montrer que le choix de la mĂ©thode d'appariement dĂ©pend de la collection considĂ©rĂ©e. Dans le cadre d'une collection orientĂ© texte, la structure peut ĂȘtre prise en compte de maniĂšre non stricte et plusieurs sous-arbres extraits du document peuvent ĂȘtre utilisĂ©s simultanĂ©ment pour Ă©valuer la similaritĂ© structurelle. Inversement, dans le cadre d'une collection orientĂ©e donnĂ©e, la prise en compte stricte de la structure est nĂ©cessaire. Etant donnĂ© que les Ă©lĂ©ments recherchĂ©s portent une sĂ©mantique, il est alors important de dĂ©tecter quelle partie du document est Ă  priori pertinente. La structure Ă  apparier doit ĂȘtre la plus prĂ©cise et minimale possible. Enfin, nos approches de mesures de la similaritĂ© structurelle se sont montrĂ©es performantes et ont amĂ©liorĂ© la pertinence des rĂ©sultats retournĂ©s par rapport Ă  l'Ă©tat de l'art, Ă  partir du moment oĂč la nature de la collection a Ă©tĂ© prise en compte dans la sĂ©lection des arbres structurels en entrĂ©e.The work presented in this PhD thesis concerns structured information retrieval and focuses on XML documents. Structured information retrieval (SIR) aims at returning to users document parts (instead of whole documents) relevant to their needs. Those needs are expressed by queries that can contain content conditions as well as structural constraints which are used to specify the location of the needed information. In this work, we are interested in the use of document structure in the retrieval process. We propose some approaches to evaluate the document-query structural similarity. Both query structural constraints and document structures can be represented as trees. Based on this observation we propose two models which aim at matching these tree structures. As tree matching is historically linked with graph theory, our first proposition is based on an adaptation of a solution from the graph theory. After conducting an in depth study of the existing graph theory algorithms, we choose to use Tree Edit Distance (TED), which measures isomorphism (tree similarity) as the minimal set of remove and replace operations to turn one tree to another. As the main drawback of TED algorithms is their time and space complexity, which impacts the overall matching runtime, we propose two ways to overcome these issues. First we propose a TED algorithm having a minimal space complexity overall. Secondly, as runtime is dependent on the input tree cardinality (size) we propose several summarization techniques. Finally, since TED is usually used to assess relatively similar trees and as TED efficiency strongly relies on its costs, we propose a novel way, based on the DTD of documents, to compute these costs. Our second proposition is based on language models which are considered as very effective IR models. Traditionally, they are use to assess the content similarity through the probability of a document model (build upon document terms) to generate the query. We take a different approach based purely on structure and consider the document and query vocabulary as a set of transitions between document structure labels. To build these vocabularies, we propose to extract and weight all the structural relationships through a relaxation process. Finally, as relevance of the returned search results is first assessed based on the content, we propose a content evaluation process which uses the document tree structure to propagate relevance: the relevance of a node is evaluated thanks to its leaves as well as with the document context and neighbour nodes content relevance. In order to validate our models we conduct some experiments on two data-sets from the reference evaluation campaign of our domain: Initiative for XML retrieval (INEX). INEX tracks provide documents collections, metrics and relevance judgments which can be used to assess and compare SIR models. The tracks we use are: * The INEX 2005 SSCAS track whose associated documents are scientific papers extracted from IEEE. We consider this collection to be text-oriented as the structure used is similar to the one we can find in a book. * The INEX 2010 Datacentric track which uses a set of documents extracted from the Internet Movie Database (IMDB) website. This collection is data-oriented as document terms are very specific while the structure carries semantic meaning. Our various experiments show that the matching strategy strongly relies on the document structure type. In text-oriented collections, the structure can be considered as non-strict and several subtrees can be simultaneously used to assess the relevance. On the opposite, structure from documents regarded as data-centered should be used as strictly as possible. The reason is that as elements labels carry semantic, documents structures contain relevant and useful information that the content does not necessarily provide. Finally, our structural similarity approaches improve relevance of the returned results compared to state-of-the-art approaches, as long as the collection nature is considered when extracting the input trees for the structural matching process

    Propositions de méthodologies pour la valorisation de la médecine traditionnelle fondées sur une ontologie

    Get PDF
    The work presented in this thesis focuses on the problematic of the valorization of traditional medicine. Traditional medicine is a very rich biological andcultural diversity. His practise is widespread and occurs in various forms. The valorization of this medicine is now a very important issue; it will capitalize this knowledge to popularize, and thus improve its performance in terms of diagnosis, treatment and cost. World Health Organization (WHO)proposes its integration into the national health system. But the practice and exercise of this medicine face many problems which make its implementation difficult. Among these problems, we can list the informal nature of its practice, its content is not formalized, its access mode is not determined, etc. We propose in this thesis, practices more efficient based on the new technology of information and communications; they based specifically on semantic resource such as the ontology which is the formal structure of an acquaintance. The methods proposed in this thesis allow to formalize the contents of this medicine, to facilitate its exercise and ultimately to succeed its revalorization.Le travail prĂ©sentĂ© dans cette thĂšse porte sur la problĂ©matique de la valorisation de la mĂ©decine traditionnelle. La mĂ©decine traditionnelle est d’une diversitĂ© biologique et culturelle trĂšs riche. Sa pratique est trĂšs rĂ©pandue et se fait sous des formes variĂ©es . La valorisation de cette mĂ©decine constitue aujourd’hui un enjeu trĂšs important ; elle permettra de capitaliser ce savoir, de le vulgariser, et donc d’amĂ©liorer ses prestations en termes de diagnostic, de traitement et de coĂ»t. L’Organisation Mondiale de la SantĂ© (OMS) propose, du reste, de l’intĂ©grer dans le systĂšme national de santĂ©. Mais la pratique et l’exercice de cette mĂ©decine rencontrent de nombreux problĂšmes qui rendent son application difficile. Parmi ces problĂšmes, nous pouvons relever le caractĂšre informel de sa pratique, son contenu non formalisĂ©, son mode d’accĂšs non dĂ©terminĂ©, etc. Nous proposons, dans cette thĂšse, des techniques de pratiques plus efficaces puisque basĂ©es sur les nouvelles technologies de l’information et de la communication ; celles-ci reposent plus spĂ©cifiquement sur la ressource sĂ©mantique telle que l’ontologie qui est la structuration formelle d’une connaissance. Les mĂ©thodes proposĂ©es dans cette thĂšse permettent de formaliser le contenu de cette mĂ©decine, pour en faciliter l’exercice et en dĂ©finitive, pour aboutir Ă  sa revalorisation

    Extraction d'information

    Get PDF

    Recherche d'information dans les images de documents

    Get PDF
    L'image de document est un objet intelligible qui vĂ©hicule de l'information et qui est dĂ©fini en fonction de son contenu. Cette thĂšse prĂ©sente trois modĂšles de repĂ©rage d'information et de recherche d'images pertinentes Ă  la requĂȘte d'un utilisateur. Le premier modĂšle de repĂ©rage des zones informationnelles est basĂ© sur l'analyse multi Ă©chelle traduisant le contraste visuel des rĂ©gions sombres par rapport au fond de l'image. Chaque rĂ©gion extraite est dĂ©finie Ă  partir de son contenu et ses caractĂ©ristiques statistiques et gĂ©omĂ©triques. L'algorithme de classification automatique est amĂ©liorĂ© par l'application de rĂšgles de production dĂ©duites des formes des objets extraits. Une premiĂšre Ă©valuation de l'extraction du texte, des logos et des photographies sur les images de l'Ă©quipe MĂ©dia Team de l'UniversitĂ© de Washington (UW-1) montre des rĂ©sultats encourageants. Le deuxiĂšme modĂšle est basĂ© sur le texte obtenu par Reconnaissance Optique de CaractĂšres (OCR). Des erreurs-grammes et des rĂšgles de production modĂ©lisant les erreurs de reconnaissance de l'OCR sont utilisĂ©es pour l'extension des mots de la requĂȘte. Le modĂšle vectoriel est alors appliquĂ© pour modĂ©liser le texte OCR des images de documents et la requĂȘte pour la recherche d'information (RI). Un apprentissage sur les images MĂ©dia Team (UW-2) et des tests sur un millier d'images Web ont validĂ© cette approche. Les rĂ©sultats obtenus indiquent une nette amĂ©lioration comparĂ©s aux mĂ©thodes standards comme le modĂšle vectoriel sans l'expansion de la requĂȘte et la mĂ©thode de recouvrement 3-grams. Pour les zones non textuelles, un troisiĂšme modĂšle vectoriel, basĂ© sur les variations des paramĂštres de l'opĂ©rateur multi-Ă©chelle SKCS(Separable Kernel with Compact Support) et une combinaison de classifieurs et d'analyse de sous-espace en composantes principales MKL (Multi-espace Karhunen-Loeve) est appliquĂ© sur une base d'apprentissage d'images de documents de Washington University et de pages Web. Les expĂ©riences ont montrĂ© une supĂ©rioritĂ© de l'interprĂ©tation et la puissance des vecteurs d'indexations dĂ©duits de la classification et reprĂ©sentant les zones non textuelles de l'image. Finalement, un systĂšme hybride d'indexation combinant les modĂšles textuels et non-textuels a Ă©tĂ© introduit pour rĂ©pondre Ă  des requĂȘtes plus complexes portant sur des parties de l'image de documents telles un texte, une illustration, un logo ou un graphe. Les expĂ©riences ont montrĂ© la puissance d'interrogation par des mots ou des images requĂȘtes et ont permis d'aboutir Ă  des rĂ©sultats encourageants dans la recherche d'images pertinentes qui surpassent ceux obtenus par les mĂ©thodes traditionnelles comme rĂ©vĂšle une Ă©valuation des rappels vs. prĂ©cision conduite sur des requĂȘtes portant sur des images de documents

    Optimisation des mouvements des conteneurs dans un terminal maritime

    Get PDF
    RÉSUMÉ De nombruses recherches ont montrĂ© l’importance et la valeur des problĂšmes de planification et d’optimisation dans un terminal maritime. Dans ce mĂ©moire, on s’intĂ©resse au problĂšme d’optimisation des mouvements des conteneurs dans le cas d’exportation. Les sĂ©quences de fonctionnement des portiques de cour et des camions sont prises en considĂ©ration en mĂȘme temps. En outre, on prend en compte les interfĂ©rences qui peuvent exister entre les portiques de cour. En fouillant dans les travaux de littĂ©rature sur les problĂšmes de planification des portiques de cour, on ne trouve pas un travail qui examine les mouvements non productifs et les interfĂ©rences possibles entre ce type de portique simultanĂ©ment, ce qui sera un point d’innovation dans notre travail. Le problĂšme de planification des opĂ©rations de chargement des conteneurs est d’abord formulĂ© en programme linĂ©aire mixte. La fonction objectif minimise le temps de complĂ©tion des opĂ©rations de manutention par les portiques de cour. Le modĂšle mathĂ©matique est basĂ© sur plusieurs hypothĂšses, tenant compte des deux phĂ©nomĂšnes d’interfĂ©rence et des mouvements non productifs. Pour rĂ©soudre le problĂšme, une approche heuristique de type Recherche Adaptative Ă  Large Voisinage (ALNS) est dĂ©veloppĂ©e. Cette mĂ©thode a la capacitĂ© de rĂ©soudre les problĂšmes d’optimisation dans un terminal Ă  conteneurs. En effet, la mĂ©thode ALNS est jugĂ©e efficace quelque soit la taille du problĂšme : 10, 20 et 100 conteneurs. Les donnĂ©es utilisĂ©es pour tester l’approche sont fictives et on a gĂ©nĂ©rĂ© plusieurs instances en variant le nombre de conteneurs et/ou le nombre d’équipements de manutention disponibles. Les tests ont permis d’évaluer l’efficacitĂ© de l’algorithme ALNS. Plusieurs scĂ©narios ont Ă©tĂ© utilisĂ©s oĂč on a combinĂ© des heuristiques de retrait et d’insertion. Les rĂ©sultats des tests nous ont montrĂ© la qualitĂ© des solutions gĂ©nĂ©rĂ©es par la mĂ©thode ALNS. Mots clĂ©s : terminal Ă  conteneurs, optimisation, planification des opĂ©rations, recherche adaptative Ă  large voisinage, programme linĂ©aire mixte;----=-=-----ABSTRACT Most of the researchers have shown the importance and the value of scheduling and optimization problems in a maritime terminal. In this work, we focus on the optimization problem for loading operations of outbound containers. Thus, the sequencing of each yard crane and of each yard truck is studied at the same time. Furthermore, we consider the possibility of potential interferences between yard cranes and rehandles which significantly influence the performance of yard cranes. In the literature about yard crane scheduling problems, there is no work that combines interference between yard cranes and rehandles at the same time which is the innovation point of our work. The scheduling problem for loading operations is formulated as a mixed linear program model. The objective function is to minimize the makespan of loading operations by yard cranes. The mathematical model is based on various assumptions and it includes the potential interferences and the rehandle. A heuristic method is developed for solving this problem, namely Adaptive Large Neighborhood Search (ALNS). This method has the potential to handle with optimization problems in a container terminal. In fact, the ALNS method is deemed to be efficient with different scale problems: 10, 20 and 100 containers. The data are fictitious and many instances are built by varying the number of containers or/and the number of equipments (yard crane and yard truck) in each time. Computational tests are made to evaluate the efficiency of the developed algorithm (ALNS) for that we used multiple strategies where we made different combinations of removal and insertion heuristics. These numerical results show the quality of solutions produced by ALNS method. Keywords: container terminal, optimization, scheduling operations, adaptive large neighborhood search, mixed linear program

    Estimation de projets web : application et analyse de fiabilité des modÚles COCOMO II et WebMo

    Get PDF
    Allant des simples pages Web aux systĂšmes transactionnels sophistiquĂ©s, les applications Web ont beaucoup Ă©voluĂ© et continuent de l'ĂȘtre. On parle mĂȘme d'une nouvelle ingĂ©nierie logicielle Ă  savoir l'ingĂ©nierie Web [pressman2005]. La mise en marchĂ© rapide et l'hĂ©tĂ©rogĂ©nĂ©itĂ© de l'Ă©quipe de dĂ©veloppement sont parmi les principales spĂ©cificitĂ©s des applications et projets Web. Ces spĂ©cificitĂ©s lancent de nouveaux dĂ©fis aux modĂšles d'estimation actuels mĂȘme pour les plus matures d'entre eux comme COCOMO II. Dans ce travail nous avons analysĂ© la fiabilitĂ© d'un nouveau modĂšle d'estimation Ă  savoir: WebMo. Ce dernier est une adaptation de la version COCOMO II avant projet au contexte du Web. L'instigateur de WebMo est Donald Reifer qui est aussi un membre trĂšs actif dans la communautĂ© de COCOMO. Reifer a prĂ©sentĂ© son nouveau modĂšle comme une alternative viable Ă  COCOMO II si on le dote en plus d'une nouvelle mĂ©trique qui tient compte des spĂ©cificitĂ©s des applications Web. Dans cette Ă©tude visant l'analyse de fiabilitĂ© de WebMo, nous avons dĂ©veloppĂ© un outil d'estimation qui permet d'estimer et comparer les efforts de dĂ©veloppement pour des projets Web selon les modĂšles COCOMO II et WebMo. En suivant un processus de sĂ©lection de projet bien dĂ©fini, nous avons choisi cinq projets Web de la banque de projets ISBSG.\ud MalgrĂ© l'immaturitĂ© du modĂšle WebMo et son caractĂšre prĂ©visionnel, les rĂ©sultats gĂ©nĂ©rĂ©s par l'outil Ă©taient conformes Ă  nos attentes. En effet, WebMo fournit des estimations de l'effort plus proches de la rĂ©alitĂ© en comparaison avec son modĂšle de base (COCOMO II version avant projet). Ceci est dĂ» essentiellement Ă  la prise en compte des objets multimĂ©dias et autres objets spĂ©cifiques aux applications Web par la nouvelle mĂ©trique de Reifer Ă  savoir: les 'Web Objects'. Un autre facteur important de succĂšs est la calibration du modĂšle qui est basĂ©e uniquement sur des projets Web. Finalement, on suggĂšre certaines recommandations telles qu'une version WebMo post-architecture pour des phases plus avancĂ©es du cycle de dĂ©veloppement et aussi tenir compte de la diversitĂ© des langages de programmation, caractĂ©ristique typique des applications Web. Nous recommandons aussi d'alimenter la base de donnĂ©es du modĂšle avec plus de projets pour une meilleure calibration et ramener sa conception Ă  une forme plus standard comme celle de COCOMO II. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Estimation, Projet Web, WebMo, COCOMO II, ISBSG, IngĂ©nierie Web

    Le repérage automatique des entités nommées dans la langue arabe : vers la création d'un systÚme à base de rÚgles

    Full text link
    Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

    SystĂšmes interactifs auto-adaptatifs par systĂšmes multi-agents auto-organisateurs : application Ă  la personnalisation de l'accĂšs Ă  l'information

    Get PDF
    Les rĂ©seaux de systĂšmes d'information tendent Ă  devenir de plus en plus complexes en raison de leur hĂ©tĂ©rogĂ©nĂ©itĂ©, de leur dynamique et de leur croissance permanente. Afin de gĂ©rer cette complexitĂ© et ces problĂšmes de surcharge informationnelle, les moteurs de recherche actuels s'appuient sur la notion de profil usager qui reprĂ©sente les centres d'intĂ©rĂȘts, les prĂ©fĂ©rences et les besoins d'un individu. Or, ces techniques dĂ©rivĂ©es de la recherche d'information et de l'apprentissage artificiel ne proposent pas de solution rĂ©ellement adaptative pour la prise en compte de l'aspect Ă©volutif du profil et le respect de la vie privĂ©e de l'utilisateur. Nous proposons d'exploiter le paradigme des systĂšmes multi-agents, et plus spĂ©cifiquement l'approche par AMAS (Adaptive Multi-Agent System), pour apporter une solution distribuĂ©e Ă  la personnalisation et Ă  l'adaptation des services offerts aux utilisateurs. Nos contributions portent tout d'abord sur l'Ă©valuation adaptative et personnalisĂ©e du feedback implicite de l'utilisateur, puis sur la construction adaptative de son profil Ă  partir de documents textuels reprĂ©sentant ses intĂ©rĂȘts. Elles proposent Ă©galement une plateforme nommĂ©e SWAPP dĂ©diĂ©e Ă  la recherche d'information personnalisĂ©e sur le Web. Ce cadre applicatif a permis d'expĂ©rimenter nos deux premiĂšres contributions individuellement, puis conjointement. Cette Ă©valuation simultanĂ©e a mis en Ă©vidence un nouveau problĂšme thĂ©orique : le couplage de deux AMAS conçus de maniĂšre totalement indĂ©pendante. Ce travail propose ainsi une premiĂšre approche pour la conception de systĂšmes de systĂšmes auto-adaptatifs.Networks of information systems are becoming more and more complex due to their heterogeneity, their dynamics and their continuous growing. In order to cope with this information overload and this complexity, nowadays search engines make use of the notion of user profile that aim to model main interests, preferences and user's needs. Nevertheless, these techniques, derived from information retrieval and artificial learning research field, does not represent truly adaptive solutions able to cope with user profiles evolutions and to ensure user's privacy. Faced to these challenges, we propose to use the multi-agent system paradigm, and more specifically the AMAS approach (Adaptive Multi-Agent System), in order to provide a distributed solution for the personalisation and the adaptation of services and information access. Our first contribution consists in the adaptive and personalised evaluation of user implicit feedback. The second contribution studies the adaptive modelling of user profile from textual documents that represents its interests. We also propose the SWAPP platform which is dedicated to the evaluation of our approach to the web personalised information retrieval. After the individual experimentation and validation of these two first contributions within this applicative framework, they have been evaluated together. This last evaluation underlined a new theoretical problem : the coupling of two AMAS that were independently designed. Thus, this study proposes a first approach for the design of systems of self-adaptive systems

    Steps towards adaptive situation and context-aware access: a contribution to the extension of access control mechanisms within pervasive information systems

    Get PDF
    L'Ă©volution des systĂšmes pervasives a ouvert de nouveaux horizons aux systĂšmes d'information classiques qui ont intĂ©grĂ© des nouvelles technologies et des services qui assurent la transparence d'accĂšs aux resources d'information Ă  n'importe quand, n'importe oĂč et n'importe comment. En mĂȘme temps, cette Ă©volution a relevĂ© des nouveaux dĂ©fis Ă  la sĂ©curitĂ© de donnĂ©es et Ă  la modĂ©lisation du contrĂŽle d'accĂšs. Afin de confronter ces challenges, differents travaux de recherche se sont dirigĂ©s vers l'extension des modĂšles de contrĂŽles d'accĂšs (en particulier le modĂšle RBAC) afin de prendre en compte la sensibilitĂ© au contexte dans le processus de prise de dĂ©cision. Mais la liaison d'une dĂ©cision d'accĂšs aux contraintes contextuelles dynamiques d'un utilisateur mobile va non seulement ajouter plus de complexitĂ© au processus de prise de dĂ©cision mais pourra aussi augmenter les possibilitĂ©s de refus d'accĂšs. Sachant que l'accessibilitĂ© est un Ă©lĂ©ment clĂ© dans les systĂšmes pervasifs et prenant en compte l'importance d'assurer l'accĂ©ssibilitĂ© en situations du temps rĂ©el, nombreux travaux de recherche ont proposĂ© d'appliquer des mĂ©canismes flexibles de contrĂŽle d'accĂšs avec des solutions parfois extrĂȘmes qui depassent les frontiĂšres de sĂ©curitĂ© telle que l'option de "Bris-de-Glace". Dans cette thĂšse, nous introduisons une solution modĂ©rĂ©e qui se positionne entre la rigiditĂ© des modĂšles de contrĂŽle d'accĂšs et la flexibilitĂ© qui expose des risques appliquĂ©es pendant des situations du temps rĂ©el. Notre contribution comprend deux volets : au niveau de conception, nous proposons PS-RBAC - un modĂšle RBAC sensible au contexte et Ă  la situation. Le modĂšle rĂ©alise des attributions des permissions adaptatives et de solution de rechange Ă  base de prise de dĂ©cision basĂ©e sur la similaritĂ© face Ă  une situation importanteÀ la phase d'exĂ©cution, nous introduisons PSQRS - un systĂšme de rĂ©Ă©criture des requĂȘtes sensible au contexte et Ă  la situation et qui confronte les refus d'accĂšs en reformulant la requĂȘte XACML de l'utilisateur et en lui proposant une liste des resources alternatives similaires qu'il peut accĂ©der. L'objectif est de fournir un niveau de sĂ©curitĂ© adaptative qui rĂ©pond aux besoins de l'utilisateur tout en prenant en compte son rĂŽle, ses contraintes contextuelles (localisation, rĂ©seau, dispositif, etc.) et sa situation. Notre proposition a Ă©tĂ© validĂ© dans trois domaines d'application qui sont riches des contextes pervasifs et des scĂ©narii du temps rĂ©el: (i) les Équipes Mobiles GĂ©riatriques, (ii) les systĂšmes avioniques et (iii) les systĂšmes de vidĂ©o surveillance.The evolution of pervasive computing has opened new horizons to classical information systems by integrating new technologies and services that enable seamless access to information sources at anytime, anyhow and anywhere. Meanwhile this evolution has opened new threats to information security and new challenges to access control modeling. In order to meet these challenges, many research works went towards extending traditional access control models (especially the RBAC model) in order to add context awareness within the decision-making process. Meanwhile, tying access decisions to the dynamic contextual constraints of mobile users would not only add more complexity to decision-making but could also increase the possibilities of access denial. Knowing that accessibility is a key feature for pervasive systems and taking into account the importance of providing access within real-time situations, many research works have proposed applying flexible access control mechanisms with sometimes extreme solutions that depass security boundaries such as the Break-Glass option. In this thesis, we introduce a moderate solution that stands between the rigidity of access control models and the riskful flexibility applied during real-time situations. Our contribution is twofold: on the design phase, we propose PS-RBAC - a Pervasive Situation-aware RBAC model that realizes adaptive permission assignments and alternative-based decision-making based on similarity when facing an important situation. On the implementation phase, we introduce PSQRS - a Pervasive Situation-aware Query Rewriting System architecture that confronts access denials by reformulating the user's XACML access request and proposing to him a list of alternative similar solutions that he can access. The objective is to provide a level of adaptive security that would meet the user needs while taking into consideration his role, contextual constraints (location, network, device, etc.) and his situation. Our proposal has been validated in three application domains that are rich in pervasive contexts and real-time scenarios: (i) Mobile Geriatric Teams, (ii) Avionic Systems and (iii) Video Surveillance Systems

    Recherche d'information et contexte

    Get PDF
    My research work is related the field of Information Retrieval (IR) whose objective is to enable a user to find information that meets its needs within a large volume of information. The work in IR have focused primarily on improving information processing in terms of indexing to obtain optimal representations of documents and queries and in terms of matching between these representations. Contributions have long made no distinction between all searches assuming a unique type of search and when proposing a model intended to be effective for this unique type of search. The growing volume of information and diversity of situations have marked the limits of existing IR approaches bringing out the field of contextual IR. Contextual IR aims to better respond to users' needs taking into account the search context. The principle is to differentiate searches by integrating in the IR process, contextual factors that will influence the IRS effectiveness. The notion of context is broad and refers to all knowledge related to information conducted by a user querying an IRS. My research has been directed toward taking into account the contextual factors that are: the domain of information, the information structure and the user. The first three directions of my work consist in proposing models that incorporate each of these elements of context, and a fourth direction aims at exploring how to adapt the process to each search according to its context. Various European and national projects have provided application frameworks for this research and have allowed us to validate our proposals. This research has also led to development of various prototypes and allowed the conduct of PhD theses and research internships.Mes travaux de recherche s'inscrivent dans le domaine de la recherche d'information (RI) dont l'objectif est de permettre Ă  un utilisateur de trouver de l'information rĂ©pondant Ă  son besoin au sein d'un volume important d'informations. Les recherches en RI ont Ă©tĂ© tout d'abord orientĂ©es systĂšme. Elles sont restĂ©es trĂšs longtemps axĂ©es sur l'appariement pour Ă©valuer la correspondance entre les requĂȘtes et les documents ainsi que sur l'indexation des documents et de requĂȘtes pour obtenir une reprĂ©sentation qui supporte leur mise en correspondance. Cela a conduit Ă  la dĂ©finition de modĂšles thĂ©oriques de RI comme le modĂšle vectoriel ou le modĂšle probabiliste. L'objectif initialement visĂ© a Ă©tĂ© de proposer un modĂšle de RI qui possĂšde un comportement global le plus efficace possible. La RI s'est longtemps basĂ©e sur des hypothĂšses simplificatrices notamment en considĂ©rant un type unique d'interrogation et en appliquant le mĂȘme traitement Ă  chaque interrogation. Le contexte dans lequel s'effectue la recherche a Ă©tĂ© ignorĂ©. Le champ d'application de la RI n'a cessĂ© de s'Ă©tendre notamment grĂące Ă  l'essor d'internet. Le volume d'information toujours plus important combinĂ© Ă  une utilisation de SRI qui s'est dĂ©mocratisĂ©e ont conduit Ă  une diversitĂ© des situations. Cet essor a rendu plus difficile l'identification des informations correspondant Ă  chaque besoin exprimĂ© par un utilisateur, marquant ainsi les limites des approches de RI existantes. Face Ă  ce constat, des propositions ont Ă©mergĂ©, visant Ă  faire Ă©voluer la RI en rapprochant l'utilisateur du systĂšme tels que les notions de rĂ©injection de pertinence utilisateur ou de profil utilisateur. Dans le but de fĂ©dĂ©rer les travaux et proposer des SRI offrant plus de prĂ©cision en rĂ©ponse au besoin de l'utilisateur, le domaine de la RI contextuelle a rĂ©cemment Ă©mergĂ©. L'objectif est de diffĂ©rencier les recherches au niveau des modĂšles de RI en intĂ©grant des Ă©lĂ©ments de contexte susceptibles d'avoir une influence sur les performances du SRI. La notion de contexte est vaste et se rĂ©fĂšre Ă  toute connaissance liĂ©e Ă  la recherche de l'utilisateur interrogeant un SRI. Mes travaux de recherche se sont orientĂ©s vers la prise en compte des Ă©lĂ©ments de contexte que sont le domaine de l'information, la structure de l'information et l'utilisateur. Ils consistent, dans le cadre de trois premiĂšres orientations, Ă  proposer des modĂšles qui intĂšgrent chacun de ces Ă©lĂ©ments de contexte, et, dans une quatriĂšme orientation, d'Ă©tudier comment adapter les processus Ă  chaque recherche en fonction de son contexte. DiffĂ©rents projets europĂ©ens et nationaux ont servi de cadre applicatifs Ă  ces recherches et ainsi Ă  valider nos propositions. Mes travaux de recherche ont Ă©galement fait l'objet de dĂ©veloppements dans diffĂ©rents prototypes et ont permis le dĂ©roulement de thĂšses de doctorat et stages de recherche
    • 

    corecore