219 research outputs found

    Contribution à la définition de modèles de recherche d'information flexibles basés sur les CP-Nets

    Get PDF
    This thesis addresses two main problems in IR: automatic query weighting and document semantic indexing. Our global contribution consists on the definition of a theoretical flexible information retrieval (IR) model based on CP-Nets. The CP-Net formalism is used for the graphical representation of flexible queries expressing qualitative preferences and for automatic weighting of such queries. Furthermore, the CP-Net formalism is used as an indexing language in order to represent document representative concepts and related relations in a roughly compact way. Concepts are identified by projection on WordNet. Concept relations are discovered by means of semantic association rules. A query evaluation mechanism based on CP-Nets graph similarity is also proposed.Ce travail de thèse adresse deux principaux problèmes en recherche d'information : (1) la formalisation automatique des préférences utilisateur, (ou la pondération automatique de requêtes) et (2) l'indexation sémantique. Dans notre première contribution, nous proposons une approche de recherche d'information (RI) flexible fondée sur l'utilisation des CP-Nets (Conditional Preferences Networks). Le formalisme CP-Net est utilisé d'une part, pour la représentation graphique de requêtes flexibles exprimant des préférences qualitatives et d'autre part pour l'évaluation flexible de la pertinence des documents. Pour l'utilisateur, l'expression de préférences qualitatives est plus simple et plus intuitive que la formulation de poids numériques les quantifiant. Cependant, un système automatisé raisonnerait plus simplement sur des poids ordinaux. Nous proposons alors une approche de pondération automatique des requêtes par quantification des CP-Nets correspondants par des valeurs d'utilité. Cette quantification conduit à un UCP-Net qui correspond à une requête booléenne pondérée. Une utilisation des CP-Nets est également proposée pour la représentation des documents dans la perspective d'une évaluation flexible des requêtes ainsi pondéreés. Dans notre seconde contribution, nous proposons une approche d'indexation conceptuelle basée sur les CP-Nets. Nous proposons d'utiliser le formalisme CP-Net comme langage d'indexation afin de représenter les concepts et les relations conditionnelles entre eux d'une manière relativement compacte. Les noeuds du CP-Net sont les concepts représentatifs du contenu du document et les relations entre ces noeuds expriment les associations conditionnelles qui les lient. Notre contribution porte sur un double aspect : d'une part, nous proposons une approche d'extraction des concepts en utilisant WordNet. Les concepts résultants forment les noeuds du CP-Net. D'autre part, nous proposons d'étendre et d'utiliser la technique de règles d'association afin de découvrir les relations conditionnelles entre les concepts noeuds du CP-Nets. Nous proposons enfin un mécanisme d'évaluation des requêtes basé sur l'appariement de graphes (les CP-Nets document et requête en l'occurrence)

    Contribution à l’amélioration de la recherche d’information par utilisation des méthodes sémantiques: application à la langue arabe

    Get PDF
    Un système de recherche d’information est un ensemble de programmes et de modules qui sert à interfacer avec l’utilisateur, pour prendre et interpréter une requête, faire la recherche dans l’index et retourner un classement des documents sélectionnés à cet utilisateur. Cependant le plus grand challenge de ce système est qu’il doit faire face au grand volume d’informations multi modales et multilingues disponibles via les bases documentaires ou le web pour trouver celles qui correspondent au mieux aux besoins des utilisateurs. A travers ce travail, nous avons présenté deux contributions. Dans la première nous avons proposé une nouvelle approche pour la reformulation des requêtes dans le contexte de la recherche d’information en arabe. Le principe est donc de représenter la requête par un arbre sémantique pondéré pour mieux identifier le besoin d'information de l'utilisateur, dont les nœuds représentent les concepts (synsets) reliés par des relations sémantiques. La construction de cet arbre est réalisée par la méthode de la Pseudo-Réinjection de la Pertinence combinée à la ressource sémantique du WordNet Arabe. Les résultats expérimentaux montrent une bonne amélioration dans les performances du système de recherche d’information. Dans la deuxième contribution, nous avons aussi proposé une nouvelle approche pour la construction d’une collection de test de recherche d’information arabe. L'approche repose sur la combinaison de la méthode de la stratégie de Pooling utilisant les moteurs de recherches et l’algorithme Naïve-Bayes de classification par l’apprentissage automatique. Pour l’expérimentation nous avons créé une nouvelle collection de test composée d’une base documentaire de 632 documents et de 165 requêtes avec leurs jugements de pertinence sous plusieurs topics. L’expérimentation a également montré l’efficacité du classificateur Bayésien pour la récupération de pertinences des documents, encore plus, il a réalisé des bonnes performances après l’enrichissement sémantique de la base documentaire par le modèle word2vec

    Contribution à la gestion de l'évolution des processus métiers

    Get PDF
    La gestion de l'évolution des processus métier exige une compréhension approfondie des cause des changements, de leurs niveaux d'application ainsi que de leurs impacts sur le reste du système. Dans cette thèse, nous proposons une approche de gestion et de contrôle de l'éolution des processus métier permettant d'analyser ces changements et de comprendre leurs impacts. Cela assistera les concepteurs et les chargés de l'évolution des processus métier à établir une évaluation a priori de l'impact pour réduire les risques et les coûts liés à ces changements et d'améliorer le service et la qualité des processus métier. Ce travail consiste à proposer un ensemble de contributions permettant une vérification de la cohérence et de la conformité des modèles de processus métier après chaque changement, mais aussi d'établir une éaluation a priori de l'impact structurel et qualificatif des modifications. Les différentes approches proposées sont en cours d'expérimentation et de validation à travers le développement d'une plate-forme basée sur l'environnement EclipseThe evolution management of the business processes requires an exhaustive understanding of the change. An evolution engineer needs to understand reasons of a change, its application levels, and subsequently its impact on the whole system. In this thesis, we propose an approach for an a priori change impact analysis, to better control the business process evolution. This may help the business experts and the process designers to evaluate change impact in order to reduce the associated risks and estimate the related costs. It may also help to improve the service and quality of the business processes. This work contributes an eventual improvement, in regard, to verify the coherence and the compliance of the business process models, after each change. It leads to evaluate an a priori change impact analysis in structural and qualitatie aspects. The multiple-perspectives of the proposed approach have been reviewed experimentally. The validation of the approach is evaluated by exteding the Eclipse Development Environment, with the help of a set of plug-ins, as a prototype plate-form.DUNKERQUE-SCD-Bib.electronique (591839901) / SudocSudocFranceF

    Régions cérébrales impliquées dans l'encodage mnésique de la douleur

    Get PDF
    Le rappel d'une douleur passée est souvent utilisé par les professionnels de la santé afin d'évaluer la progression d'une douleur clinique et l'efficacité des moyens mis en place pour la traiter. Hors, le rappel d'une douleur est rarement précis et ceci représente une entrave majeure au processus décisionnel du traitement de la douleur clinique. À ce jour, on ignore toujours les mécanismes neuronaux engagés dans la formation de la mémoire d'une douleur et ceci est regrettable puisqu'aucune disposition ne peut être prise pour favoriser le rappel précis de la douleur. Il est aujourd'hui bien documenté que les mécanismes cérébraux engagés au moment de l'encodage mnésique sont essentiels dans la formation de la mémoire à long terme. En se basant sur ces résultats, nous avons postulé que l'activité cérébrale engagée au moment de l'encodage d'une douleur pourrait permettre de prédire la précision du rappel à long terme de cette douleur. Des stimulations électriques transcutanées, provoquant des sensations non-douloureuses et douloureuses, ont été administrées chez 21 participants en santé tout en procédant à l'enregistrement de leur activité cérébrale par la technique d'imagerie par résonance magnétique fonctionnelle (IRMf). Le rappel de la douleur a été évalué deux mois plus tard. La différence entre le rappel de la douleur et l'intensité de la douleur a constitué la variable dépendante principale, soit le score de précision du rappel de la douleur (PRD). Ces scores ont été rectifiés, de façon à ce que de faibles scores représentent un rappel précis de la douleur et de hauts scores représentent un rappel imprécis de la douleur. La douleur expérimentale a provoqué l'activation des régions classiquement associées au traitement et à la perception de la douleur, soit les cortex somatosensoriels primaires et secondaires, le cortex insulaire, le thalamus, le cortex cingulé antérieur et le cervelet (Z > 2.4, p < 0.05). L'analyse corrélationnelle principale a démontré que les scores de PRD étaient significativement et négativement associés à l'activité de l'insula dorso-antérieure gauche à l'encodage (r = -0.7549, p < 0.05 après correction pour mesures répétées). Aucune association similaire n'a été observée pour les stimulations électriques non-douloureuses. L'insula dorso-antérieure est traditionnellement associée à la saillance émotionnelle, l'interoception et la pertinence personnelle relative à une expérience. Puisque la précision du rappel est associée l'activité insulaire et qu'il a été démontré que le rappel d'un évènement qui nous concerne personnellement est plus précis, il est possible que le rappel d'une douleur passée soit plus précis lorsque la sensation ou le contexte a une importante signification émotionnelle ou personnelle

    Le choix de la date optimale des investissements irréversibles dans les projets pétroliers avec asymétrie d'information et incertitude : l'approche des options réelles

    Get PDF
    Ce travail vise à contribuer à l'élargissement de l'approche des options réelles dans l'examen du choix de la date optimale des investissements irréversibles, en présence d'un côté, du problème d'agence, dû à l'information privée, et de l'autre côté, d'un remboursement préétabli de la firme au principal. Nous introduisons un jeu entre un gouvernement et un agent dans lequel, le gouvernement (le principal) délègue à un agent (la firme) la décision concernant le choix de la date optimale d'un investissement en vue d'extraire ses réserves pétrolières. En contrepartie, la firme verse un remboursement préétabli (taxe) au propriétaire (gouvernement). L'agent détient une information privée sur une partie de coût constant de l'investissement, tandis que le principal connaît seulement sa fonction de distribution. Quant à l'autre partie du coût constant de l'investissement, elle est supposée connue par les deux agents. L'information privée dont dispose la firme est par hypothèse constante. De plus, la firme produit une quantité de pétrole fixe jusqu'à épuisement de ressources. Elle rembourse au propriétaire un pourcentage constant de cette quantité extraite sous forme de Royalty (taxe) et celui-ci dépend de l'information privée de la firme. La seule source de l'incertitude provient du prix de l'actif sous-jacent qui varie stochastiquement selon un Mouvement Brownien géométrique (MBG). Nous ignorons toute présence des coûts autre que le coût de l'investissement. Nous supposons que la firme a l'option d'attendre avant de se lancer dans le projet. Son problème est de choisir la date optimale de l'investissement, étant donné son information privée et l'incertitude sur le prix. Tandis que le problème du principal est de concevoir le contrat optimal qui incite la firme à révéler la vraie valeur de son information privée, afin d'optimiser la valeur de son opportunité d'investissement. En plus, nous faisons l'hypothèse que le gouvernement a le pouvoir de s'engager, d'une manière crédible à ne pas renégocier sa politique de révélation, une fois la firme révèle son coût jusqu'à la fin du projet. Nous montrons, que le principal, sous information parfaite choisira la même date optimale d'investissement que celle choisie par la firme sans intervention du gouvernement. De plus, nous montrons, en utilisant l'approche des options réelles, que la présence d'asymétrie d'information retarde le choix de la date optimale de l'investissement ce qui cause une distorsion qui entraîne un sous-investissement. Le niveau efficace de l'investissement social ne peut pas être atteint en présence d'une asymétrie d'information. Enfin, nous montrons que pour des valeurs élevées de coût de l'investissement, la rente de la firme est nulle. En revanche, pour un coût d'investissement minimal, la rente du principal est maximale. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Option réelle, Contrats pétroliers, Asymétrie d'information, Irréversibilité, Incertitude, Valeur d'option, Prix critique, Royalty

    Evolution de profils multi-attributs, par apprentissage automatique et adaptatif dans un système de recommandation pour l'aide à la décision

    Get PDF
    La prise en compte des profils utilisateurs ainsi que leurs évolutions, dans le domaine de l'aide à la décision, constitue actuellement dans la communauté des SIAD (Systèmes Interactifs d'Aide à la Décision) un enjeu important. En effet, la prise en compte du contexte lors de la décision est actuellement émergente pour les SIAD. Ces systèmes d'assistance offrent ainsi des conseils aux utilisateurs en se basant sur leur profil, qui représente leurs préférences à travers une liste de critères valués. Les principales contraintes viennent du fait qu'il est nécessaire que le système puisse amener de l'information pertinente de manière continue. Cela oblige donc à faire évoluer les profils des utilisateurs en fonction de leurs actions. Pour cela, le système ne doit pas seulement " comprendre " ce que l'utilisateur aime, mais également pourquoi. De plus, l'aide apportée aux utilisateurs évoluera donc dans le temps et également par rapport à l'utilisateur. Ainsi l'utilisateur aura à sa disposition une sorte d'assistant personnalisé. L'objectif du travail consiste à apporter une aide à l'activité de l'utilisateur en fonction de son profil. Pour cela, nous proposons de mettre en œuvre et de développer des algorithmes, basés sur des techniques issues du domaine de l'apprentissage, afin de faire évoluer le profil d'un utilisateur en fonction de ses actions. L'aide apportée à l'utilisateur par le système évoluera aussi en fonction de l'évolution de son profil. Le problème à traiter pour l'utilisateur est un problème de prise de décision. Pour ce problème, une assistance est apportée à l'utilisateur, et celle-ci se fait par un affinage des solutions potentielles. Cet affinage est effectué grâce à la mise en place d'un tri (ranking) évolutif des solutions qui sont présentées à l'utilisateur en fonction de son/ses profils. La réalisation d'un tel système nécessite l'articulation des trois principaux domaines de recherche ; qui sont l'Aide à la Décision multicritère, la Décomposition et Agrégation de préférence, et l'Apprentissage automatique. Les domaines de l'Aide à la Décision multicritère et de la Décomposition et Agrégation de préférence peuvent être aussi rassemblés en tant que Procédure d'Agrégation Multicritère (PAMC). Certaines méthodes d'Aide à la Décision multicritère sont mises en place ici et utilisent les données du profil afin d'apporter la meilleure aide possible à l'utilisateur. La décomposition est utilisée pour caractériser un objet afin de fournir à l'apprentissage les données nécessaires à son fonctionnement. L'agrégation quant à elle sert à obtenir une note sur un objet, et cela selon le profil de l'utilisateur, afin de pouvoir effectuer un classement (ranking). L'apprentissage sert à faire évoluer les profils des utilisateurs afin d'avoir toujours un profil représentant le plus fidèlement possible les préférences des utilisateurs. En effet les préférences des utilisateurs évoluant dans le temps, il est nécessaire de traiter ces changements afin d'adapter les réponses à apporter à l'utilisateur. Les contributions de cette thèse portent tout d'abord sur la définition, la construction et l'évolution d'un profil utilisateur (profiling évolutif) en fonction des actions explicites et implicites de l'utilisateur. Ce profiling évolutif est mis en œuvre au sein d'un système de recommandation utilisable sans base d'apprentissage, de manière synchrone et totalement incrémentale, et qui permet aux utilisateurs de changer rapidement de préférences et même d'être incohérents (rationalité limitée). Ce système, qui vient en complément d'un système de Recherche Information, a pour objectif d'établir un ordre total sur une liste d'éléments proposés à l'utilisateur (ranking), et ce en concordance avec les préférences de l'utilisateur. Ces contributions consistent également à la définition de techniques qui permettent d'apporter des parties de solutions à des verrous technologiques comme la désagrégation de critères et la prise en compte d'un nombre variable de critères dans le processus d'aide à la décision interactif, et ce sans définir au préalable de famille cohérente de critères sur laquelle est basée la décision. Plusieurs cadres applicatifs ont été définis afin d'évaluer le système par rapport à d'autres systèmes, mais également afin de tester ses performances de manière hors ligne avec des vraies données utilisateurs, ainsi qu'en ligne, en utilisant directement le système.Considering user profiles and their evolutions, for decision support is currently in the community of DSS (Decision Support Systems) an important issue. Indeed, the inclusion of context in the decision is currently emerging for DSS. Indeed the system offers advice to users based on their profile, which represents their preferences through a list of valued criteria. The main constraints come from the fact that the system need to continuously bring relevant information. It therefore requires changing user profiles thanks to their actions. So, the system must not only "understand" what the user likes, but also why. The users' assistance will evolve over time and therefore with the user. Thus the user has at his disposal a kind of personal assistant. The objective of this work is to provide assistance to the user's activity according to his profile. The objective is to develop an algorithm based on automatic techniques, in order to change the profile of a user based on his actions. The assistance provided to the user by the system will evolves according to the evolution of its profile. The problem addressed to the user is a problem of decision making. For this problem, assistance is provided to the user, and it is a refinement of potential solutions. This refining is done through the establishment of scalable scheduling solutions that are presented to the user depending on his / her profile. The realization of such a system requires the articulation of the three main areas of research which are the Multi-Criteria Decision Support, the Disaggregation and Aggregation of preferences, and Machine Learning. The fields of Decision Support and Multi Disaggregation and Aggregation preference can also be assembled as Multi-Criteria Aggregation Process (PAMC). Some methods of Multicriteria Decision Support are set up here and use profile data to provide the best possible support to the user. The decomposition is used to characterize an object to provide data to the learning algorithm required for its operation. Aggregation serves to score an object according to the user profile in order to rank the selected items. Machine Learning is used to change user profiles in order to always have a profile representing as closely as possible the preferences of users. Indeed user preferences change over the time, it is necessary to address these changes in order to adapt the answers to the user. The contributions of this thesis are firstly, the definition, construction and evolution of a user profile (evolutionary profiling) based on explicit and implicit user's actions. This evolutionary profiling is implemented within a recommender system usable without learning base, synchronously and completely incremental, and that allows users to quickly change their preferences and even to be inconsistent (bounded rationality). This system, which complements an Information System Research, aims to establish a total order on a list of items proposed to the user (ranking) and in accordance with his preferences. These also include the definition of techniques used to make parts of solutions to technological challenges as the disintegration of criteria and the inclusion of a variable number of criteria in the process of interactive decision support, and this without firstly defining coherent family of criteria on which the decision is based. Several application frameworks have been developed to evaluate the system and compare it to other systems, but also to test its performance with real user data in an offline mode, and in an online mode using directly the system

    Vers une approche d’adaptation dynamique et temps-réel du contenu informationnel d’une interface utilisateur dans un environnement ubiquitaire

    Get PDF
    Ubiquitous environments are often considered highly dynamic environments and the contextual information can change at runtime. User interface should provide the right information for the right person at the right time. Certainly, such objective can be achieved only when we deduce the realtime user’s requirements in terms of information and present this information to the user according to his current context of use. The specific goal of our research is to improve the adaptation process while improving models at runtime. A fixed model cannot handle the high dynamic in such an environment. The model can progress and change its structure to better deduce the user’s requirements. Selecting the appropriate model is not that easy. To address this problem, adaptation strategies will be based on evolutionary models. Such models can be created while integrating progressively a range of elementary actions or undergo modifications and changes as the result of interactions with the user and through reinterpretations of existing models stored by the acquisition of preceding knowledge. Our approach takes advantage of OWL-S’s properties in order to describe the dynamic functioning of Petri-nets models. We formulate a Petri-nets based elementary action by using an OWL-S atomic process. And then, we progressively compose a set of elementary actions to formulate a Petri-nets based activity. The presented method lays a sound foundation for dynamic composition of Petri-nets based modeling.L’adaptation au contexte suivant notre cadre d’étude peut être définie par la flexibilité des interfaces utilisateur à évoluer au cours de l’interaction en fonction du contexte de l’utilisateur. Et puisque généralement la pertinence des modèles dépend de la qualité de l’adaptation dynamique de l’interface, l’adaptation qui se base sur un modèle fixe de fonctionnement n’est plus appropriée dans les environnements ubiquitaires. Le Contexte a tendance à varier énormément au cours de l’interaction avec l’utilisateur dans un environnement très dynamique. D’où, la déduction de l’information nécessaire au moment approprié pour un utilisateur quelconque exige une plus grande flexibilité, ainsi une méthode statique de fonctionnement est certainement insuffisante. Cette complexité croit lorsque les informations fournies à l’utilisateur doivent correspondre à certaines caractéristiques spécifiques et individuelles des utilisateurs. Une approche de modélisation dynamique a été soigneusement décrite. Nous y avons démontré l’adaptation temps-réel des informations fournies à l’utilisateur à ses spécificités, à ses préférences, à son activité en cours et au changement de son contexte d’usage. L’utilisateur se situant dans un environnement ubiquitaire arrivera nécessairement à recevoir sur son interface l’information dont il a besoin. En procédant de cette manière, nous nous sommes parvenu implicitement à aider l’utilisateur à accomplir sa tâche en cours. Il s’agit, en fait, de la principale motivation de l’Informatique Ubiquitaire que notre stratégie nous a permis, entre autres, de la respecter

    Personnalisation d'analyses décisionnelles sur des données multidimensionnelles

    Get PDF
    This thesis investigates OLAP analysis personalization within multidimensional databases. OLAP analyse is modeled through a graph where nodes represent the analysis contexts and graph edges represent the user operations. The analysis context regroups the user query as well as result. It is well described by a specific tree structure that is independent on the visualization structures of data and query languages. We provided a model for user preferences on the multidimensional schema and values. Each preference is associated with a specific analysis context. Based on previous models, we proposed a generic framework that includes two personalization processes. First process, denoted query personalization, aims to enhancing user query with related preferences in order to produce a new one that generates a personalized result. Second personalization process is query recommendation that allows helping user throughout the OLAP data exploration phase. Our recommendation framework supports three recommendation scenarios, i.e., assisting user in query composition, suggesting the forthcoming query, and suggesting alternative queries. Recommendations are built progressively basing on user preferences. In order to implement our framework, we developed a prototype system that supports query personalization and query recommendation processes. We present experimental results showing the efficiency and the effectiveness of our approaches.Le travail présenté dans cette thèse aborde la problématique de la personnalisation des analyses OLAP au sein des bases de données multidimensionnelles. Une analyse OLAP est modélisée par un graphe dont les noeuds représentent les contextes d'analyse et les arcs traduisent les opérations de l'utilisateur. Le contexte d'analyse regroupe la requête et le résultat. Il est décrit par un arbre spécifique qui est indépendant des structures de visualisation des données et des langages de requête. Par ailleurs, nous proposons un modèle de préférences utilisateur exprimées sur le schéma multidimensionnel et sur les valeurs. Chaque préférence est associée à un contexte d'analyse particulier. En nous basant sur ces modèles, nous proposons un cadre générique comportant deux mécanismes de personnalisation. Le premier mécanisme est la personnalisation de requête. Il permet d'enrichir la requête utilisateur à l'aide des préférences correspondantes afin de générer un résultat qui satisfait au mieux aux besoins de l'usager. Le deuxième mécanisme de personnalisation est la recommandation de requêtes qui permet d'assister l'utilisateur tout au long de son exploration des données OLAP. Trois scénarios de recommandation sont définis : l'assistance à la formulation de requête, la proposition de la prochaine requête et la suggestion de requêtes alternatives. Ces recommandations sont construites progressivement à l'aide des préférences de l'utilisateur. Afin valider nos différentes contributions, nous avons développé un prototype qui intègre les mécanismes de personnalisation et de recommandation de requête proposés. Nous présentons les résultats d'expérimentations montrant la performance et l'efficacité de nos approches. Mots-clés: OLAP, analyse décisionnelle, personnalisation de requête, système de recommandation, préférence utilisateur, contexte d'analyse, appariement d'arbres de contexte

    Système de recherche d’information étendue basé sur une projection multi-espaces

    Get PDF
    Depuis son apparition au début des années 90, le World Wide Web (WWW ou Web) a offert un accès universel aux connaissances et le monde de l’information a été principalement témoin d’une grande révolution (la révolution numérique). Il est devenu rapidement très populaire, ce qui a fait de lui la plus grande et vaste base de données et de connaissances existantes grâce à la quantité et la diversité des données qu'il contient. Cependant, l'augmentation et l’évolution considérables de ces données soulèvent d'importants problèmes pour les utilisateurs notamment pour l’accès aux documents les plus pertinents à leurs requêtes de recherche. Afin de faire face à cette explosion exponentielle du volume de données et faciliter leur accès par les utilisateurs, différents modèles sont proposés par les systèmes de recherche d’information (SRIs) pour la représentation et la recherche des documents web. Les SRIs traditionnels utilisent, pour indexer et récupérer ces documents, des mots-clés simples qui ne sont pas sémantiquement liés. Cela engendre des limites en termes de la pertinence et de la facilité d'exploration des résultats. Pour surmonter ces limites, les techniques existantes enrichissent les documents en intégrant des mots-clés externes provenant de différentes sources. Cependant, ces systèmes souffrent encore de limitations qui sont liées aux techniques d’exploitation de ces sources d’enrichissement. Lorsque les différentes sources sont utilisées de telle sorte qu’elles ne peuvent être distinguées par le système, cela limite la flexibilité des modèles d'exploration qui peuvent être appliqués aux résultats de recherche retournés par ce système. Les utilisateurs se sentent alors perdus devant ces résultats, et se retrouvent dans l'obligation de les filtrer manuellement pour sélectionner l'information pertinente. S’ils veulent aller plus loin, ils doivent reformuler et cibler encore plus leurs requêtes de recherche jusqu'à parvenir aux documents qui répondent le mieux à leurs attentes. De cette façon, même si les systèmes parviennent à retrouver davantage des résultats pertinents, leur présentation reste problématique. Afin de cibler la recherche à des besoins d'information plus spécifiques de l'utilisateur et améliorer la pertinence et l’exploration de ses résultats de recherche, les SRIs avancés adoptent différentes techniques de personnalisation de données qui supposent que la recherche actuelle d'un utilisateur est directement liée à son profil et/ou à ses expériences de navigation/recherche antérieures. Cependant, cette hypothèse ne tient pas dans tous les cas, les besoins de l’utilisateur évoluent au fil du temps et peuvent s’éloigner de ses intérêts antérieurs stockés dans son profil. Dans d’autres cas, le profil de l’utilisateur peut être mal exploité pour extraire ou inférer ses nouveaux besoins en information. Ce problème est beaucoup plus accentué avec les requêtes ambigües. Lorsque plusieurs centres d’intérêt auxquels est liée une requête ambiguë sont identifiés dans le profil de l’utilisateur, le système se voit incapable de sélectionner les données pertinentes depuis ce profil pour répondre à la requête. Ceci a un impact direct sur la qualité des résultats fournis à cet utilisateur. Afin de remédier à quelques-unes de ces limitations, nous nous sommes intéressés dans ce cadre de cette thèse de recherche au développement de techniques destinées principalement à l'amélioration de la pertinence des résultats des SRIs actuels et à faciliter l'exploration de grandes collections de documents. Pour ce faire, nous proposons une solution basée sur un nouveau concept d'indexation et de recherche d'information appelé la projection multi-espaces. Cette proposition repose sur l'exploitation de différentes catégories d'information sémantiques et sociales qui permettent d'enrichir l'univers de représentation des documents et des requêtes de recherche en plusieurs dimensions d'interprétations. L’originalité de cette représentation est de pouvoir distinguer entre les différentes interprétations utilisées pour la description et la recherche des documents. Ceci donne une meilleure visibilité sur les résultats retournés et aide à apporter une meilleure flexibilité de recherche et d'exploration, en donnant à l’utilisateur la possibilité de naviguer une ou plusieurs vues de données qui l’intéressent le plus. En outre, les univers multidimensionnels de représentation proposés pour la description des documents et l’interprétation des requêtes de recherche aident à améliorer la pertinence des résultats de l’utilisateur en offrant une diversité de recherche/exploration qui aide à répondre à ses différents besoins et à ceux des autres différents utilisateurs. Cette étude exploite différents aspects liés à la recherche personnalisée et vise à résoudre les problèmes engendrés par l’évolution des besoins en information de l’utilisateur. Ainsi, lorsque le profil de cet utilisateur est utilisé par notre système, une technique est proposée et employée pour identifier les intérêts les plus représentatifs de ses besoins actuels dans son profil. Cette technique se base sur la combinaison de trois facteurs influents, notamment le facteur contextuel, fréquentiel et temporel des données. La capacité des utilisateurs à interagir, à échanger des idées et d’opinions, et à former des réseaux sociaux sur le Web, a amené les systèmes à s’intéresser aux types d’interactions de ces utilisateurs, au niveau d’interaction entre eux ainsi qu’à leurs rôles sociaux dans le système. Ces informations sociales sont abordées et intégrées dans ce travail de recherche. L’impact et la manière de leur intégration dans le processus de RI sont étudiés pour améliorer la pertinence des résultats. Since its appearance in the early 90's, the World Wide Web (WWW or Web) has provided universal access to knowledge and the world of information has been primarily witness to a great revolution (the digital revolution). It quickly became very popular, making it the largest and most comprehensive database and knowledge base thanks to the amount and diversity of data it contains. However, the considerable increase and evolution of these data raises important problems for users, in particular for accessing the documents most relevant to their search queries. In order to cope with this exponential explosion of data volume and facilitate their access by users, various models are offered by information retrieval systems (IRS) for the representation and retrieval of web documents. Traditional SRIs use simple keywords that are not semantically linked to index and retrieve these documents. This creates limitations in terms of the relevance and ease of exploration of results. To overcome these limitations, existing techniques enrich documents by integrating external keywords from different sources. However, these systems still suffer from limitations that are related to the exploitation techniques of these sources of enrichment. When the different sources are used so that they cannot be distinguished by the system, this limits the flexibility of the exploration models that can be applied to the results returned by this system. Users then feel lost to these results, and find themselves forced to filter them manually to select the relevant information. If they want to go further, they must reformulate and target their search queries even more until they reach the documents that best meet their expectations. In this way, even if the systems manage to find more relevant results, their presentation remains problematic. In order to target research to more user-specific information needs and improve the relevance and exploration of its research findings, advanced SRIs adopt different data personalization techniques that assume that current research of user is directly related to his profile and / or previous browsing / search experiences. However, this assumption does not hold in all cases, the needs of the user evolve over time and can move away from his previous interests stored in his profile. In other cases, the user's profile may be misused to extract or infer new information needs. This problem is much more accentuated with ambiguous queries. When multiple POIs linked to a search query are identified in the user's profile, the system is unable to select the relevant data from that profile to respond to that request. This has a direct impact on the quality of the results provided to this user. In order to overcome some of these limitations, in this research thesis, we have been interested in the development of techniques aimed mainly at improving the relevance of the results of current SRIs and facilitating the exploration of major collections of documents. To do this, we propose a solution based on a new concept and model of indexing and information retrieval called multi-spaces projection. This proposal is based on the exploitation of different categories of semantic and social information that enrich the universe of document representation and search queries in several dimensions of interpretations. The originality of this representation is to be able to distinguish between the different interpretations used for the description and the search for documents. This gives a better visibility on the results returned and helps to provide a greater flexibility of search and exploration, giving the user the ability to navigate one or more views of data that interest him the most. In addition, the proposed multidimensional representation universes for document description and search query interpretation help to improve the relevance of the user's results by providing a diversity of research / exploration that helps meet his diverse needs and those of other different users. This study exploits different aspects that are related to the personalized search and aims to solve the problems caused by the evolution of the information needs of the user. Thus, when the profile of this user is used by our system, a technique is proposed and used to identify the interests most representative of his current needs in his profile. This technique is based on the combination of three influential factors, including the contextual, frequency and temporal factor of the data. The ability of users to interact, exchange ideas and opinions, and form social networks on the Web, has led systems to focus on the types of interactions these users have at the level of interaction between them as well as their social roles in the system. This social information is discussed and integrated into this research work. The impact and how they are integrated into the IR process are studied to improve the relevance of the results
    • …
    corecore