18 research outputs found

    Fouille de texte : une approche séquentielle pour découvrir des relations spatiales

    Get PDF
    National audienceDans cet article, nous prĂ©sentons les premiĂšres Ă©tapes d'un projet de fouille de donnĂ©es textuelles. Plus prĂ©cisĂ©ment, nous appliquons un algorithme d'extraction de motifs sĂ©quentiels sous contraintes multiples afin d'identifier des relations entre entitĂ©s spatiales. Les premiers rĂ©sultats obtenus montrent l'intĂ©rĂȘt de l'utilisation de cette approche et ses limites. Dans cet article, nous dĂ©taillons les premiĂšres bases de travaux plus ambitieux dont l'objectif est d'apporter des informations cruciales permettant de complĂ©ter l'analyse des images satellitaires

    Fouille de données de santé

    Get PDF
    Dans le domaine de la santĂ©, les techniques d’analyse de donnĂ©es sont de plus en plus populaires et se rĂ©vĂšlent mĂȘme indispensables pour gĂ©rer les gros volumes de donnĂ©es produits pour un patient et par le patient. Deux thĂ©matiques seront abordĂ©es dans cette prĂ©sentation d'HDR.La premiĂšre porte sur la dĂ©finition, la formalisation, l’implĂ©mentation et la validation de mĂ©thodes d’analyse permettant de dĂ©crire le contenu de bases de donnĂ©es mĂ©dicales. Je me suis particuliĂšrement intĂ©ressĂ©e aux donnĂ©es sĂ©quentielles. J’ai fait Ă©voluer la classique notion de motif sĂ©quentiel pour y intĂ©grer des composantes contextuelles, spatiales et sur l’ordre partiel des Ă©lĂ©ments composant les motifs. Ces nouvelles informations enrichissent la sĂ©mantique initiale de ces motifs.La seconde thĂ©matique se focalise sur l’analyse des productions et des interactions des patients au travers des mĂ©dias sociaux. J’ai principalement travaillĂ© sur des mĂ©thodes permettant d’analyser les productions narratives des patients selon leurs temporalitĂ©s, leurs thĂ©matiques, les sentiments associĂ©s ou encore le rĂŽle et la rĂ©putation du locuteur s’étant exprimĂ© dans les messages

    Interrogation d'un réseau sémantique de documents : l'intertextualité dans l'accÚs à l'information juridique

    Get PDF
    A collection of documents is generally represented as a set of documents but this simple representation does not take into account cross references between documents, which often defines their context of interpretation. This standard document model is less adapted for specific professional uses in specialized domains in which documents are related by many various references and the access tools need to consider this complexity. We propose two models based on formal and relational concept analysis and on semantic web techniques. Applied on documentary objects, these two models represent and query in a unified way documents content descriptors and documents relations.Une collection documentaire est gĂ©nĂ©ralement reprĂ©sentĂ©e comme un ensemble de documents mais cette modĂ©lisation ne permet pas de rendre compte des relations intertextuelles et du contexte d'interprĂ©tation d'un document. Le modĂšle documentaire classique trouve ses limites dans les domaines spĂ©cialisĂ©s oĂč les besoins d'accĂšs Ă  l'information correspondent Ă  des usages spĂ©cifiques et oĂč les documents sont liĂ©s par de nombreux types de relations. Ce travail de thĂšse propose deux modĂšles permettant de prendre en compte cette complexitĂ© des collections documentaire dans les outils d'accĂšs Ă  l'information. Le premier modĂšle est basĂ©e sur l'analyse formelle et relationnelle de concepts, le deuxiĂšme est basĂ©e sur les technologies du web sĂ©mantique. AppliquĂ©es sur des objets documentaires ces modĂšles permettent de reprĂ©senter et d'interroger de maniĂšre unifiĂ©e les descripteurs de contenu des documents et les relations intertextuelles qu'ils entretiennent

    TOTh 2010, Terminology & Ontology: Theories and applications

    Get PDF
    International audienceAvant proposCette annĂ©e la confĂ©rence a Ă©tĂ© prĂ©cĂ©dĂ©e d’une journĂ©e de formation consacrĂ©e Ă  la terminologie et l’ontologie, Ă  leurs liens et leurs apports mutuels. L’intĂ©rĂȘt qu’a suscitĂ© cette journĂ©e nous amĂšnera certainement Ă  rĂ©itĂ©rer l’opĂ©ration les annĂ©es suivantes.Le succĂšs de la confĂ©rence d’ouverture de notre collĂšgue FrĂ©dĂ©ric Nef, portant sur l’ontologie prise dans sa dimension philosophique, a montrĂ©, s’il en Ă©tait encore besoin, la richesse d’une approche pluridisciplinaire.AnimĂ©es par diffĂ©rents prĂ©sidents, les sessions ont alternĂ© prĂ©sentations thĂ©oriques et dĂ©monstrations de systĂšmes, offrant ainsi l’opportunitĂ© Ă  plusieurs industriels de nous parler de leurs projets. L’éventail des sujets abordĂ©s, Ă  travers les quatorze prĂ©sentations retenues (incluant la confĂ©rence d’ouverture) rĂ©parties sur deux jours, illustre la richesse mais aussi la vitalitĂ© de notre communautĂ© : aide Ă  la traduction, thĂ©saurus multilingue, phrasĂ©ologie, entitĂ© nommĂ©, recherche d’information, etc. L’ « actualitĂ© » n’était pas oubliĂ©e Ă  travers une ontologie des risques financiers.Enfin, les ConfĂ©rences TOTh sont devenues internationales Ă  partir de cette annĂ©e avec le français et l’anglais comme langues officielles. Le comitĂ© de programme s’est ouvert Ă  de nouveaux membres portant Ă  dix le nombre de pays reprĂ©sentĂ©s et Ă  plus de 40% le nombre de personnalitĂ©s Ă©trangĂšres. Gageons que cette ouverture sera prometteuse.Christophe RochePrĂ©sident du ComitĂ© Scientifiqu

    18Ăšme Atelier "Raisonnement Ă  Partir de Cas" RĂ PC 2010

    Get PDF
    National audienceLe raisonnement Ă  partir de cas (RĂ PC) est un paradigme de rĂ©solution de problĂšmes s'appuyant sur la rĂ©utilisation d'expĂ©riences passĂ©es pour rĂ©soudre de nouveaux problĂšmes. Les applications du RĂ PC sont nombreuses et la recherche est particuli'erement active en France et dans le monde. Les rencontres annuelles de la communautĂ© franžcaise ont Ă©tĂ© organisĂ©es depuis 1992 par le groupe français de recherche en RĂ PC, sous la forme d'ateliers d'un Ă  deux jours, permettant de prĂ©senter et de discuter les travaux, thĂ©oriques ou appliquĂ©s, Ă  diffĂ©rents stades d'avancement. Cette annĂ©e 2010, le 18Ăšme atelier RĂ PC est organisĂ© Ă  Strasbourg, en amont des assises du GDR I3 (" Information, Interaction, Intelligence "). À cette occasion, l'atelier RĂ PC partage une demi-journĂ©e avec les rencontres du thĂšme IAF " Intelligence Artificielle Fondamentale " du GDR I3. Le programme complet est ainsi constituĂ© de neuf prĂ©sentations, huit soumises Ă  l'atelier RĂ PC et une soumise aux journĂ©es IAF. Ces prĂ©sentations sont rĂ©parties en quatre sessions : une premiĂšre session porte sur des applications du RĂ PC Ă  l'espace et aux dĂ©placements ; une deuxiĂšme session (en deux temps) regroupe diffĂ©rents travaux sur l'adaptation ; les deux autres sessions sont consacrĂ©es pour l'une Ă  la rĂ©utilisation d'expĂ©riences et Ă  la remĂ©moration, et pour l'autre Ă  la comparaison du RĂ PC Ă  d'autres mĂ©thodes appuyĂ©es sur l'expĂ©rience

    L’organisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche d’information.

    No full text
    Ce mĂ©moire d’habilitation Ă  diriger des recherches dresse une synthĂšse des travaux rĂ©alisĂ©s en sciences de l’information et de la communication et portent sur la description et la caractĂ©risation de contenus textuels, sur leur reprĂ©sentation sous la forme de connaissances organisĂ©es et mĂ©diatisĂ©es pour la recherche d’information. L’organisation des connaissances est abordĂ©e comme un « objet d’étude des processus cognitifs et des techniques intellectuelles qui permettent de classer, indexer, formaliser et modĂ©liser le rĂ©el » (Polity et al. 2005, p. 13). La recherche d’information est un paradigme structurant pour apprĂ©hender cet objet. Dans la premiĂšre partie du mĂ©moire, la recherche d’information est saisie dans le seul rapport Ă  la technique : les connaissances linguistiques sont utilisĂ©es pour organiser les donnĂ©es afin d’amĂ©liorer l’indexation en texte intĂ©gral et la classification de textes. Dans la seconde partie, la recherche d’information est apprĂ©hendĂ©e comme une activitĂ© humaine et sociale : les connaissances linguistiques sont utilisĂ©es pour favoriser l’accĂšs aux documents et permettre diverses activitĂ©s informationnelles (lire, Ă©crire, annoter, partager, etc.). Ce mĂ©moire tĂ©moigne d’un parcours qui traverse les deux grandes conceptions de l’information. La premiĂšre est inspirĂ©e du courant nord-amĂ©ricain de l’information retrieval qui cherche Ă  Ă©tablir des principes gĂ©nĂ©raux de l’information, les technologies qui permettent de la traiter et de la rendre accessible. La seconde est inspirĂ©e de courants en sciences humaines et sociales (information seeking notamment) et donne la primeur aux usages de l’information et aux pratiques informationnelles dans des contextes socio-professionnels prĂ©cis

    L’organisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche d’information.

    Get PDF
    Ce mĂ©moire d’habilitation Ă  diriger des recherches dresse une synthĂšse des travaux rĂ©alisĂ©s en sciences de l’information et de la communication et portent sur la description et la caractĂ©risation de contenus textuels, sur leur reprĂ©sentation sous la forme de connaissances organisĂ©es et mĂ©diatisĂ©es pour la recherche d’information. L’organisation des connaissances est abordĂ©e comme un « objet d’étude des processus cognitifs et des techniques intellectuelles qui permettent de classer, indexer, formaliser et modĂ©liser le rĂ©el » (Polity et al. 2005, p. 13). La recherche d’information est un paradigme structurant pour apprĂ©hender cet objet. Dans la premiĂšre partie du mĂ©moire, la recherche d’information est saisie dans le seul rapport Ă  la technique : les connaissances linguistiques sont utilisĂ©es pour organiser les donnĂ©es afin d’amĂ©liorer l’indexation en texte intĂ©gral et la classification de textes. Dans la seconde partie, la recherche d’information est apprĂ©hendĂ©e comme une activitĂ© humaine et sociale : les connaissances linguistiques sont utilisĂ©es pour favoriser l’accĂšs aux documents et permettre diverses activitĂ©s informationnelles (lire, Ă©crire, annoter, partager, etc.). Ce mĂ©moire tĂ©moigne d’un parcours qui traverse les deux grandes conceptions de l’information. La premiĂšre est inspirĂ©e du courant nord-amĂ©ricain de l’information retrieval qui cherche Ă  Ă©tablir des principes gĂ©nĂ©raux de l’information, les technologies qui permettent de la traiter et de la rendre accessible. La seconde est inspirĂ©e de courants en sciences humaines et sociales (information seeking notamment) et donne la primeur aux usages de l’information et aux pratiques informationnelles dans des contextes socio-professionnels prĂ©cis

    L'AIS : une donnée pour l'analyse des activités en mer

    Get PDF
    4 pages, session "Mer et littoral"International audienceCette contribution présente des éléments méthodologiques pour la description des activités humaines en mer dans une perspective d'aide à la gestion. Différentes procédures, combinant l'exploitation de bases de données spatio-temporelles issue de données AIS archivées à des analyses spatiales au sein d'un SIG, sont testées afin de caractériser le transport maritime en Mer d'Iroise (Bretagne, France) sur les plans spatiaux, temporels et quantitatifs au cours d'une année

    Configuration interactive et contraintes : connaissances, filtrage et extensions

    Get PDF
    The value of our research work is rooted in the following observations :-1- the life cycle of products, systems, services and processes is tending to get shorter ; -2- new designs and updates of products on the market are becoming more and more frequent, leading to increasingly short design cycles ; -3 technologies are constantly changing, requiring permanent, ongoing acquisition of knowledge ; -4-the diversity of products offered on the market is growing all the time, ranging from customizable or configurable to made-to-measure or designed to order.These trends, and the mass of information and knowledge that requires treating as a result of them, are placing heavy demands on designers, requiring ever more attentiveness and increasingly intense cognitive effort. The result is an increased risk that the product does not fully meet the customer’s needs, that it is difficult to implement or manufacture, or that it will be prohibitively expensive. The aim of our work is thus to help the design process to reduce these risks and errors by delivering software tools and methodological environments that serve to capitalize and exploit general, contextual, academic, expert or business knowledge.Our work on various complex industrial cases has led us to take into consideration two kinds of knowledge, involving on the one hand the "product domain" and on the other the "product diversity element". Each kind of knowledge leads to differing industrial cases. The first kind of knowledge encompasses the scientific and technical aspects, but also the specific rules governing the business in question. This knowledge is required in order to define the product itself, and involves issues that can be resolved by aiding the product /system/service design. The second kind of knowledge relates to the diverse nature of the products, and involves issues of customization or configuration of the product/system/service.Our aim is to help in what might be called "routine" design, where different kinds and various types of knowledge exist, due to the recurrent nature of the activity. We consider that aid in design or configuration can be formalized, either completely or partially, in the form of a constraint satisfaction problem (CSP). In this context, we focus more specifically on interactive decision-support, by introducing the principles of filtering or constraint propagation. The diversity of knowledge formalized as a CSP and the interaction with the user allow us to assemble and adapt filtering algorithms in a generic constraint propagation engine, integrated in our CoFiADe software solution.In addition, this formalism based on CSP constraints is complemented by : - ontologies to structure knowledge and facilitate its reuse throughout the development cycle, - analogy-based approaches taking advantage of contextual knowledge encapsulated in the case under study, so as to make recommendations to the user on the choice of values, - evolutionary approaches to optimize the search for multi-criteria solutions.Les travaux de recherche présentés dans ce mémoire trouvent leurs fondements dans les constats suivants :-1- la durée de vie des produits et systèmes tend à se réduire,-2- les conceptions et les actualisations des produits mis sur le marché sont de plus en plus fréquentes alors que les cycles de conception sont toujours plus brefs,-3- les technologies employées en constante évolution nécessitent une acquisition de connaissance permanente,-4- la diversité des produits offerte sur les marchés ne cesse de croître allant des produits personnali- sables ou configurés jusqu’aux produits sur-mesure et conçus à la commande.Ces tendances et la masse d’informations et de connaissances à traiter en découlant exigent des concepteurs toujours plus d’attention et un travail cognitif toujours plus intense. Il en résulte une augmentation des risques, que le produit réponde imparfaitement aux besoins du demandeur, qu’il soit difficilement réalisable et fabricable, ou encore qu’il le soit à un coût prohibitif. L’objectif de nos travaux est donc de limiter ces risques et erreurs en proposant des outils logiciels et des environnements méthodologiques destinés à capitaliser et exploiter des connaissances générales, contextuelles, académiques, expertes ou métier pour aider la conception.Les travaux effectués sur différentes problématiques industrielles ont conduit à prendre en considération deux natures de connaissances relevant du « domaine produit » et de la « diversité produit » conduisant à des problématiques industrielles différentes : la première nature de connaissance recouvre aussi bien des aspects scientifiques et techniques que des règles métier, elle est nécessaire pour la définition du produit et débouche sur des problématiques d’aide à la conception de produit ; la seconde nature est une connaissance liée à la diversité des produits, qui débouche sur les problématiques d’aide à la personnalisation ou configuration de produit.Nous visons à aider un type de conception plutôt « routinier » où de la connaissance de différentes natures et de divers types existe du fait de la récurrence de l’activité. Nous considérons de plus dans nos travaux que l’aide à la conception ou configuration peut se formaliser, complètement ou partiellement, comme un problème de satisfaction de contraintes (CSP). Dans ce cadre, nous nous intéressons plus spécifiquement à l’aide à la décision interactive exploitant les principes de filtrage ou de propagation de contraintes. Notre objectif se décline alors en l’accompagnement des concepteurs dans la construction des solutions répondant au mieux à leurs problèmes, en retirant progressivement de l’espace des solutions, celles qui ne sont plus cohérentes avec les décisions prises, en estimant celles-ci au fil de leur construction et/ou en les optimisant.en complément, nous associons à ce formalisme à base de contraintes CSP :- des ontologies pour structurer les connaissances et faciliter leur réutilisateion sur l’ensemble du cycle de développement,- des approches par analogie exploitant de la connaissance contextuelle encapsulée dans des cas afin de proposer à l’utilisateur des recommandations quant aux choix de valeurs,- des approches évolutionnaires pour optimiser la recherche des solutions de manière multicritère

    Du besoin d'informations Ă  la formulation des requĂȘtes : Ă©tude des usages de diffĂ©rents types d'utilisateurs visant l'amĂ©lioration d'un systĂšme de recherche d'informations

    Get PDF
    With the massive and heterogeneous web document collections, IR system must analyze the behaviors of users which are unpredictable and varied. The approach described in this thesis provides a comparison of the verbalizations for both natural language and web query for the same information need by the same user. For this, we used data collected (i.e. users' complaints in natural language and web queries) through a search engine dedicated to economic reports in French over 5 consecutive years totaling a corpus of 1398 natural language requests and 3427 web queries. Then, we compared the expression of the information need and highlighted the contributions in terms of information and clarification, the use of either language used.Devant des collections massives et hĂ©tĂ©rogĂšnes de donnĂ©es, les systĂšmes de RI doivent dĂ©sormais pouvoir apprĂ©hender des comportements d'utilisateurs aussi variĂ©s qu'imprĂ©visibles. L'objectif de notre travail est d'Ă©valuer la façon dont un mĂȘme utilisateur verbalise un besoin informationnel Ă  travers un Ă©noncĂ© de type « expression libre » (appelĂ© langage naturel) et un Ă©noncĂ© de type mots-clĂ©s (appelĂ© langage de requĂȘtes). Pour cela, nous nous situons dans un contexte applicatif, Ă  savoir des demandes de remboursement des utilisateurs d'un moteur de recherche dĂ©diĂ© Ă  des Ă©tudes Ă©conomiques en français. Nous avons recueilli via ce moteur, les deux types d'Ă©noncĂ©s sur 5 annĂ©es consĂ©cutives totalisant un corpus de 1398 demandes en langage naturel et de 3427 requĂȘtes. Nous avons alors comparĂ© l'expression en tant que tel du besoin informationnel et mis en avant ce qu'apportait, en termes d'informations et de prĂ©cisions, le recours Ă  l'un ou l'autre du langage utilisĂ©
    corecore