18 research outputs found
Fouille de texte : une approche séquentielle pour découvrir des relations spatiales
National audienceDans cet article, nous prĂ©sentons les premiĂšres Ă©tapes d'un projet de fouille de donnĂ©es textuelles. Plus prĂ©cisĂ©ment, nous appliquons un algorithme d'extraction de motifs sĂ©quentiels sous contraintes multiples afin d'identifier des relations entre entitĂ©s spatiales. Les premiers rĂ©sultats obtenus montrent l'intĂ©rĂȘt de l'utilisation de cette approche et ses limites. Dans cet article, nous dĂ©taillons les premiĂšres bases de travaux plus ambitieux dont l'objectif est d'apporter des informations cruciales permettant de complĂ©ter l'analyse des images satellitaires
Fouille de données de santé
Dans le domaine de la santĂ©, les techniques dâanalyse de donnĂ©es sont de plus en plus populaires et se rĂ©vĂšlent mĂȘme indispensables pour gĂ©rer les gros volumes de donnĂ©es produits pour un patient et par le patient. Deux thĂ©matiques seront abordĂ©es dans cette prĂ©sentation d'HDR.La premiĂšre porte sur la dĂ©finition, la formalisation, lâimplĂ©mentation et la validation de mĂ©thodes dâanalyse permettant de dĂ©crire le contenu de bases de donnĂ©es mĂ©dicales. Je me suis particuliĂšrement intĂ©ressĂ©e aux donnĂ©es sĂ©quentielles. Jâai fait Ă©voluer la classique notion de motif sĂ©quentiel pour y intĂ©grer des composantes contextuelles, spatiales et sur lâordre partiel des Ă©lĂ©ments composant les motifs. Ces nouvelles informations enrichissent la sĂ©mantique initiale de ces motifs.La seconde thĂ©matique se focalise sur lâanalyse des productions et des interactions des patients au travers des mĂ©dias sociaux. Jâai principalement travaillĂ© sur des mĂ©thodes permettant dâanalyser les productions narratives des patients selon leurs temporalitĂ©s, leurs thĂ©matiques, les sentiments associĂ©s ou encore le rĂŽle et la rĂ©putation du locuteur sâĂ©tant exprimĂ© dans les messages
Interrogation d'un réseau sémantique de documents : l'intertextualité dans l'accÚs à l'information juridique
A collection of documents is generally represented as a set of documents but this simple representation does not take into account cross references between documents, which often defines their context of interpretation. This standard document model is less adapted for specific professional uses in specialized domains in which documents are related by many various references and the access tools need to consider this complexity. We propose two models based on formal and relational concept analysis and on semantic web techniques. Applied on documentary objects, these two models represent and query in a unified way documents content descriptors and documents relations.Une collection documentaire est gĂ©nĂ©ralement reprĂ©sentĂ©e comme un ensemble de documents mais cette modĂ©lisation ne permet pas de rendre compte des relations intertextuelles et du contexte d'interprĂ©tation d'un document. Le modĂšle documentaire classique trouve ses limites dans les domaines spĂ©cialisĂ©s oĂč les besoins d'accĂšs Ă l'information correspondent Ă des usages spĂ©cifiques et oĂč les documents sont liĂ©s par de nombreux types de relations. Ce travail de thĂšse propose deux modĂšles permettant de prendre en compte cette complexitĂ© des collections documentaire dans les outils d'accĂšs Ă l'information. Le premier modĂšle est basĂ©e sur l'analyse formelle et relationnelle de concepts, le deuxiĂšme est basĂ©e sur les technologies du web sĂ©mantique. AppliquĂ©es sur des objets documentaires ces modĂšles permettent de reprĂ©senter et d'interroger de maniĂšre unifiĂ©e les descripteurs de contenu des documents et les relations intertextuelles qu'ils entretiennent
TOTh 2010, Terminology & Ontology: Theories and applications
International audienceAvant proposCette annĂ©e la confĂ©rence a Ă©tĂ© prĂ©cĂ©dĂ©e dâune journĂ©e de formation consacrĂ©e Ă la terminologie et lâontologie, Ă leurs liens et leurs apports mutuels. LâintĂ©rĂȘt quâa suscitĂ© cette journĂ©e nous amĂšnera certainement Ă rĂ©itĂ©rer lâopĂ©ration les annĂ©es suivantes.Le succĂšs de la confĂ©rence dâouverture de notre collĂšgue FrĂ©dĂ©ric Nef, portant sur lâontologie prise dans sa dimension philosophique, a montrĂ©, sâil en Ă©tait encore besoin, la richesse dâune approche pluridisciplinaire.AnimĂ©es par diffĂ©rents prĂ©sidents, les sessions ont alternĂ© prĂ©sentations thĂ©oriques et dĂ©monstrations de systĂšmes, offrant ainsi lâopportunitĂ© Ă plusieurs industriels de nous parler de leurs projets. LâĂ©ventail des sujets abordĂ©s, Ă travers les quatorze prĂ©sentations retenues (incluant la confĂ©rence dâouverture) rĂ©parties sur deux jours, illustre la richesse mais aussi la vitalitĂ© de notre communautĂ© : aide Ă la traduction, thĂ©saurus multilingue, phrasĂ©ologie, entitĂ© nommĂ©, recherche dâinformation, etc. Lâ « actualitĂ© » nâĂ©tait pas oubliĂ©e Ă travers une ontologie des risques financiers.Enfin, les ConfĂ©rences TOTh sont devenues internationales Ă partir de cette annĂ©e avec le français et lâanglais comme langues officielles. Le comitĂ© de programme sâest ouvert Ă de nouveaux membres portant Ă dix le nombre de pays reprĂ©sentĂ©s et Ă plus de 40% le nombre de personnalitĂ©s Ă©trangĂšres. Gageons que cette ouverture sera prometteuse.Christophe RochePrĂ©sident du ComitĂ© Scientifiqu
18Ăšme Atelier "Raisonnement Ă Partir de Cas" RĂ PC 2010
National audienceLe raisonnement à partir de cas (Rà PC) est un paradigme de résolution de problÚmes s'appuyant sur la réutilisation d'expériences passées pour résoudre de nouveaux problÚmes. Les applications du Rà PC sont nombreuses et la recherche est particuli'erement active en France et dans le monde. Les rencontres annuelles de la communauté franžcaise ont été organisées depuis 1992 par le groupe français de recherche en Rà PC, sous la forme d'ateliers d'un à deux jours, permettant de présenter et de discuter les travaux, théoriques ou appliqués, à différents stades d'avancement. Cette année 2010, le 18Úme atelier Rà PC est organisé à Strasbourg, en amont des assises du GDR I3 (" Information, Interaction, Intelligence "). à cette occasion, l'atelier Rà PC partage une demi-journée avec les rencontres du thÚme IAF " Intelligence Artificielle Fondamentale " du GDR I3. Le programme complet est ainsi constitué de neuf présentations, huit soumises à l'atelier Rà PC et une soumise aux journées IAF. Ces présentations sont réparties en quatre sessions : une premiÚre session porte sur des applications du Rà PC à l'espace et aux déplacements ; une deuxiÚme session (en deux temps) regroupe différents travaux sur l'adaptation ; les deux autres sessions sont consacrées pour l'une à la réutilisation d'expériences et à la remémoration, et pour l'autre à la comparaison du Rà PC à d'autres méthodes appuyées sur l'expérience
Lâorganisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche dâinformation.
Ce mĂ©moire dâhabilitation Ă diriger des recherches dresse une synthĂšse des travaux rĂ©alisĂ©s en sciences de lâinformation et de la communication et portent sur la description et la caractĂ©risation de contenus textuels, sur leur reprĂ©sentation sous la forme de connaissances organisĂ©es et mĂ©diatisĂ©es pour la recherche dâinformation. Lâorganisation des connaissances est abordĂ©e comme un « objet dâĂ©tude des processus cognitifs et des techniques intellectuelles qui permettent de classer, indexer, formaliser et modĂ©liser le rĂ©el » (Polity et al. 2005, p. 13). La recherche dâinformation est un paradigme structurant pour apprĂ©hender cet objet. Dans la premiĂšre partie du mĂ©moire, la recherche dâinformation est saisie dans le seul rapport Ă la technique : les connaissances linguistiques sont utilisĂ©es pour organiser les donnĂ©es afin dâamĂ©liorer lâindexation en texte intĂ©gral et la classification de textes. Dans la seconde partie, la recherche dâinformation est apprĂ©hendĂ©e comme une activitĂ© humaine et sociale : les connaissances linguistiques sont utilisĂ©es pour favoriser lâaccĂšs aux documents et permettre diverses activitĂ©s informationnelles (lire, Ă©crire, annoter, partager, etc.). Ce mĂ©moire tĂ©moigne dâun parcours qui traverse les deux grandes conceptions de lâinformation. La premiĂšre est inspirĂ©e du courant nord-amĂ©ricain de lâinformation retrieval qui cherche Ă Ă©tablir des principes gĂ©nĂ©raux de lâinformation, les technologies qui permettent de la traiter et de la rendre accessible. La seconde est inspirĂ©e de courants en sciences humaines et sociales (information seeking notamment) et donne la primeur aux usages de lâinformation et aux pratiques informationnelles dans des contextes socio-professionnels prĂ©cis
Lâorganisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche dâinformation.
Ce mĂ©moire dâhabilitation Ă diriger des recherches dresse une synthĂšse des travaux rĂ©alisĂ©s en sciences de lâinformation et de la communication et portent sur la description et la caractĂ©risation de contenus textuels, sur leur reprĂ©sentation sous la forme de connaissances organisĂ©es et mĂ©diatisĂ©es pour la recherche dâinformation. Lâorganisation des connaissances est abordĂ©e comme un « objet dâĂ©tude des processus cognitifs et des techniques intellectuelles qui permettent de classer, indexer, formaliser et modĂ©liser le rĂ©el » (Polity et al. 2005, p. 13). La recherche dâinformation est un paradigme structurant pour apprĂ©hender cet objet. Dans la premiĂšre partie du mĂ©moire, la recherche dâinformation est saisie dans le seul rapport Ă la technique : les connaissances linguistiques sont utilisĂ©es pour organiser les donnĂ©es afin dâamĂ©liorer lâindexation en texte intĂ©gral et la classification de textes. Dans la seconde partie, la recherche dâinformation est apprĂ©hendĂ©e comme une activitĂ© humaine et sociale : les connaissances linguistiques sont utilisĂ©es pour favoriser lâaccĂšs aux documents et permettre diverses activitĂ©s informationnelles (lire, Ă©crire, annoter, partager, etc.). Ce mĂ©moire tĂ©moigne dâun parcours qui traverse les deux grandes conceptions de lâinformation. La premiĂšre est inspirĂ©e du courant nord-amĂ©ricain de lâinformation retrieval qui cherche Ă Ă©tablir des principes gĂ©nĂ©raux de lâinformation, les technologies qui permettent de la traiter et de la rendre accessible. La seconde est inspirĂ©e de courants en sciences humaines et sociales (information seeking notamment) et donne la primeur aux usages de lâinformation et aux pratiques informationnelles dans des contextes socio-professionnels prĂ©cis
L'AIS : une donnée pour l'analyse des activités en mer
4 pages, session "Mer et littoral"International audienceCette contribution présente des éléments méthodologiques pour la description des activités humaines en mer dans une perspective d'aide à la gestion. Différentes procédures, combinant l'exploitation de bases de données spatio-temporelles issue de données AIS archivées à des analyses spatiales au sein d'un SIG, sont testées afin de caractériser le transport maritime en Mer d'Iroise (Bretagne, France) sur les plans spatiaux, temporels et quantitatifs au cours d'une année
Configuration interactive et contraintes : connaissances, filtrage et extensions
The value of our research work is rooted in the following observations :-1- the life cycle of products, systems, services and processes is tending to get shorter ; -2- new designs and updates of products on the market are becoming more and more frequent, leading to increasingly short design cycles ; -3 technologies are constantly changing, requiring permanent, ongoing acquisition of knowledge ; -4-the diversity of products offered on the market is growing all the time, ranging from customizable or configurable to made-to-measure or designed to order.These trends, and the mass of information and knowledge that requires treating as a result of them, are placing heavy demands on designers, requiring ever more attentiveness and increasingly intense cognitive effort. The result is an increased risk that the product does not fully meet the customerâs needs, that it is difficult to implement or manufacture, or that it will be prohibitively expensive. The aim of our work is thus to help the design process to reduce these risks and errors by delivering software tools and methodological environments that serve to capitalize and exploit general, contextual, academic, expert or business knowledge.Our work on various complex industrial cases has led us to take into consideration two kinds of knowledge, involving on the one hand the "product domain" and on the other the "product diversity element". Each kind of knowledge leads to differing industrial cases. The first kind of knowledge encompasses the scientific and technical aspects, but also the specific rules governing the business in question. This knowledge is required in order to define the product itself, and involves issues that can be resolved by aiding the product /system/service design. The second kind of knowledge relates to the diverse nature of the products, and involves issues of customization or configuration of the product/system/service.Our aim is to help in what might be called "routine" design, where different kinds and various types of knowledge exist, due to the recurrent nature of the activity. We consider that aid in design or configuration can be formalized, either completely or partially, in the form of a constraint satisfaction problem (CSP). In this context, we focus more specifically on interactive decision-support, by introducing the principles of filtering or constraint propagation. The diversity of knowledge formalized as a CSP and the interaction with the user allow us to assemble and adapt filtering algorithms in a generic constraint propagation engine, integrated in our CoFiADe software solution.In addition, this formalism based on CSP constraints is complemented by : - ontologies to structure knowledge and facilitate its reuse throughout the development cycle, - analogy-based approaches taking advantage of contextual knowledge encapsulated in the case under study, so as to make recommendations to the user on the choice of values, - evolutionary approaches to optimize the search for multi-criteria solutions.Les travaux de recherche preÌsenteÌs dans ce meÌmoire trouvent leurs fondements dans les constats suivants :-1- la dureÌe de vie des produits et systeÌmes tend aÌ se reÌduire,-2- les conceptions et les actualisations des produits mis sur le marcheÌ sont de plus en plus freÌquentes alors que les cycles de conception sont toujours plus brefs,-3- les technologies employeÌes en constante eÌvolution neÌcessitent une acquisition de connaissance permanente,-4- la diversiteÌ des produits offerte sur les marcheÌs ne cesse de croiÌtre allant des produits personnali- sables ou configureÌs jusquâaux produits sur-mesure et conçus aÌ la commande.Ces tendances et la masse dâinformations et de connaissances aÌ traiter en deÌcoulant exigent des concepteurs toujours plus dâattention et un travail cognitif toujours plus intense. Il en reÌsulte une augmentation des risques, que le produit reÌponde imparfaitement aux besoins du demandeur, quâil soit difficilement reÌalisable et fabricable, ou encore quâil le soit aÌ un couÌt prohibitif. Lâobjectif de nos travaux est donc de limiter ces risques et erreurs en proposant des outils logiciels et des environnements meÌthodologiques destineÌs aÌ capitaliser et exploiter des connaissances geÌneÌrales, contextuelles, acadeÌmiques, expertes ou meÌtier pour aider la conception.Les travaux effectueÌs sur diffeÌrentes probleÌmatiques industrielles ont conduit aÌ prendre en consideÌration deux natures de connaissances relevant du « domaine produit » et de la « diversiteÌ produit » conduisant aÌ des probleÌmatiques industrielles diffeÌrentes : la premieÌre nature de connaissance recouvre aussi bien des aspects scientifiques et techniques que des reÌgles meÌtier, elle est neÌcessaire pour la deÌfinition du produit et deÌbouche sur des probleÌmatiques dâaide aÌ la conception de produit ; la seconde nature est une connaissance lieÌe aÌ la diversiteÌ des produits, qui deÌbouche sur les probleÌmatiques dâaide aÌ la personnalisation ou configuration de produit.Nous visons aÌ aider un type de conception plutoÌt « routinier » ouÌ de la connaissance de diffeÌrentes natures et de divers types existe du fait de la reÌcurrence de lâactiviteÌ. Nous consideÌrons de plus dans nos travaux que lâaide aÌ la conception ou configuration peut se formaliser, compleÌtement ou partiellement, comme un probleÌme de satisfaction de contraintes (CSP). Dans ce cadre, nous nous inteÌressons plus speÌcifiquement aÌ lâaide aÌ la deÌcision interactive exploitant les principes de filtrage ou de propagation de contraintes. Notre objectif se deÌcline alors en lâaccompagnement des concepteurs dans la construction des solutions reÌpondant au mieux aÌ leurs probleÌmes, en retirant progressivement de lâespace des solutions, celles qui ne sont plus coheÌrentes avec les deÌcisions prises, en estimant celles-ci au fil de leur construction et/ou en les optimisant.en compleÌment, nous associons aÌ ce formalisme aÌ base de contraintes CSP :- des ontologies pour structurer les connaissances et faciliter leur reÌutilisateion sur lâensemble du cycle de deÌveloppement,- des approches par analogie exploitant de la connaissance contextuelle encapsuleÌe dans des cas afin de proposer aÌ lâutilisateur des recommandations quant aux choix de valeurs,- des approches eÌvolutionnaires pour optimiser la recherche des solutions de manieÌre multicriteÌre
Du besoin d'informations Ă la formulation des requĂȘtes : Ă©tude des usages de diffĂ©rents types d'utilisateurs visant l'amĂ©lioration d'un systĂšme de recherche d'informations
With the massive and heterogeneous web document collections, IR system must analyze the behaviors of users which are unpredictable and varied. The approach described in this thesis provides a comparison of the verbalizations for both natural language and web query for the same information need by the same user. For this, we used data collected (i.e. users' complaints in natural language and web queries) through a search engine dedicated to economic reports in French over 5 consecutive years totaling a corpus of 1398 natural language requests and 3427 web queries. Then, we compared the expression of the information need and highlighted the contributions in terms of information and clarification, the use of either language used.Devant des collections massives et hĂ©tĂ©rogĂšnes de donnĂ©es, les systĂšmes de RI doivent dĂ©sormais pouvoir apprĂ©hender des comportements d'utilisateurs aussi variĂ©s qu'imprĂ©visibles. L'objectif de notre travail est d'Ă©valuer la façon dont un mĂȘme utilisateur verbalise un besoin informationnel Ă travers un Ă©noncĂ© de type « expression libre » (appelĂ© langage naturel) et un Ă©noncĂ© de type mots-clĂ©s (appelĂ© langage de requĂȘtes). Pour cela, nous nous situons dans un contexte applicatif, Ă savoir des demandes de remboursement des utilisateurs d'un moteur de recherche dĂ©diĂ© Ă des Ă©tudes Ă©conomiques en français. Nous avons recueilli via ce moteur, les deux types d'Ă©noncĂ©s sur 5 annĂ©es consĂ©cutives totalisant un corpus de 1398 demandes en langage naturel et de 3427 requĂȘtes. Nous avons alors comparĂ© l'expression en tant que tel du besoin informationnel et mis en avant ce qu'apportait, en termes d'informations et de prĂ©cisions, le recours Ă l'un ou l'autre du langage utilisĂ©