Search CORE

18 research outputs found

Fouille de texte : une approche séquentielle pour découvrir des relations spatiales

Author: Alatrista Salas Hugo
Béchet Nicolas
Publication venue: HAL CCSD
Publication date: 01/01/2014
Field of study

National audienceDans cet article, nous présentons les premières étapes d'un projet de fouille de données textuelles. Plus précisément, nous appliquons un algorithme d'extraction de motifs séquentiels sous contraintes multiples afin d'identifier des relations entre entités spatiales. Les premiers résultats obtenus montrent l'intérêt de l'utilisation de cette approche et ses limites. Dans cet article, nous détaillons les premières bases de travaux plus ambitieux dont l'objectif est d'apporter des informations cruciales permettant de compléter l'analyse des images satellitaires

HAL-CentraleSupelec

INRIA a CCSD electronic archive server

HAL Descartes

HAL-CIRAD

HAL-Rennes 1

Fouille de données de santé

Author: Bringay Sandra
Publication venue: HAL CCSD
Publication date: 02/10/2015
Field of study

Dans le domaine de la santé, les techniques d’analyse de données sont de plus en plus populaires et se révèlent même indispensables pour gérer les gros volumes de données produits pour un patient et par le patient. Deux thématiques seront abordées dans cette présentation d'HDR.La première porte sur la définition, la formalisation, l’implémentation et la validation de méthodes d’analyse permettant de décrire le contenu de bases de données médicales. Je me suis particulièrement intéressée aux données séquentielles. J’ai fait évoluer la classique notion de motif séquentiel pour y intégrer des composantes contextuelles, spatiales et sur l’ordre partiel des éléments composant les motifs. Ces nouvelles informations enrichissent la sémantique initiale de ces motifs.La seconde thématique se focalise sur l’analyse des productions et des interactions des patients au travers des médias sociaux. J’ai principalement travaillé sur des méthodes permettant d’analyser les productions narratives des patients selon leurs temporalités, leurs thématiques, les sentiments associés ou encore le rôle et la réputation du locuteur s’étant exprimé dans les messages

Thèses en Ligne

Interrogation d'un réseau sémantique de documents : l'intertextualité dans l'accès à l'information juridique

Author: Mimouni Nada
Publication venue: HAL CCSD
Publication date: 27/01/2015
Field of study

A collection of documents is generally represented as a set of documents but this simple representation does not take into account cross references between documents, which often defines their context of interpretation. This standard document model is less adapted for specific professional uses in specialized domains in which documents are related by many various references and the access tools need to consider this complexity. We propose two models based on formal and relational concept analysis and on semantic web techniques. Applied on documentary objects, these two models represent and query in a unified way documents content descriptors and documents relations.Une collection documentaire est généralement représentée comme un ensemble de documents mais cette modélisation ne permet pas de rendre compte des relations intertextuelles et du contexte d'interprétation d'un document. Le modèle documentaire classique trouve ses limites dans les domaines spécialisés où les besoins d'accès à l'information correspondent à des usages spécifiques et où les documents sont liés par de nombreux types de relations. Ce travail de thèse propose deux modèles permettant de prendre en compte cette complexité des collections documentaire dans les outils d'accès à l'information. Le premier modèle est basée sur l'analyse formelle et relationnelle de concepts, le deuxième est basée sur les technologies du web sémantique. Appliquées sur des objets documentaires ces modèles permettent de représenter et d'interroger de manière unifiée les descripteurs de contenu des documents et les relations intertextuelles qu'ils entretiennent

Thèses en Ligne

HAL-Paris 13

TOTh 2010, Terminology & Ontology: Theories and applications

Author: Roche Christophe
Publication venue: Institut Porphyre, Savoir et Connaissance
Publication date: 03/06/2010
Field of study

International audienceAvant proposCette année la conférence a été précédée d’une journée de formation consacrée à la terminologie et l’ontologie, à leurs liens et leurs apports mutuels. L’intérêt qu’a suscité cette journée nous amènera certainement à réitérer l’opération les années suivantes.Le succès de la conférence d’ouverture de notre collègue Frédéric Nef, portant sur l’ontologie prise dans sa dimension philosophique, a montré, s’il en était encore besoin, la richesse d’une approche pluridisciplinaire.Animées par différents présidents, les sessions ont alterné présentations théoriques et démonstrations de systèmes, offrant ainsi l’opportunité à plusieurs industriels de nous parler de leurs projets. L’éventail des sujets abordés, à travers les quatorze présentations retenues (incluant la conférence d’ouverture) réparties sur deux jours, illustre la richesse mais aussi la vitalité de notre communauté : aide à la traduction, thésaurus multilingue, phraséologie, entité nommé, recherche d’information, etc. L’ « actualité » n’était pas oubliée à travers une ontologie des risques financiers.Enfin, les Conférences TOTh sont devenues internationales à partir de cette année avec le français et l’anglais comme langues officielles. Le comité de programme s’est ouvert à de nouveaux membres portant à dix le nombre de pays représentés et à plus de 40% le nombre de personnalités étrangères. Gageons que cette ouverture sera prometteuse.Christophe RochePrésident du Comité Scientifiqu

Hal - Université Grenoble Alpes

HAL Université de Savoie

18ème Atelier "Raisonnement à Partir de Cas" RàPC 2010

Author: Le Ber Florence
Renaud Jean
Publication venue: HAL CCSD
Publication date: 01/01/2010
Field of study

National audienceLe raisonnement à partir de cas (RàPC) est un paradigme de résolution de problèmes s'appuyant sur la réutilisation d'expériences passées pour résoudre de nouveaux problèmes. Les applications du RàPC sont nombreuses et la recherche est particuli'erement active en France et dans le monde. Les rencontres annuelles de la communauté fran¸caise ont été organisées depuis 1992 par le groupe français de recherche en RàPC, sous la forme d'ateliers d'un à deux jours, permettant de présenter et de discuter les travaux, théoriques ou appliqués, à différents stades d'avancement. Cette année 2010, le 18ème atelier RàPC est organisé à Strasbourg, en amont des assises du GDR I3 (" Information, Interaction, Intelligence "). À cette occasion, l'atelier RàPC partage une demi-journée avec les rencontres du thème IAF " Intelligence Artificielle Fondamentale " du GDR I3. Le programme complet est ainsi constitué de neuf présentations, huit soumises à l'atelier RàPC et une soumise aux journées IAF. Ces présentations sont réparties en quatre sessions : une première session porte sur des applications du RàPC à l'espace et aux déplacements ; une deuxième session (en deux temps) regroupe différents travaux sur l'adaptation ; les deux autres sessions sont consacrées pour l'une à la réutilisation d'expériences et à la remémoration, et pour l'autre à la comparaison du RàPC à d'autres méthodes appuyées sur l'expérience

INRIA a CCSD electronic archive server

HAL-INSU

L’organisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche d’information.

Author: Clavier Viviane
Publication venue: HAL CCSD
Publication date: 10/03/2014
Field of study

Ce mémoire d’habilitation à diriger des recherches dresse une synthèse des travaux réalisés en sciences de l’information et de la communication et portent sur la description et la caractérisation de contenus textuels, sur leur représentation sous la forme de connaissances organisées et médiatisées pour la recherche d’information. L’organisation des connaissances est abordée comme un « objet d’étude des processus cognitifs et des techniques intellectuelles qui permettent de classer, indexer, formaliser et modéliser le réel » (Polity et al. 2005, p. 13). La recherche d’information est un paradigme structurant pour appréhender cet objet. Dans la première partie du mémoire, la recherche d’information est saisie dans le seul rapport à la technique : les connaissances linguistiques sont utilisées pour organiser les données afin d’améliorer l’indexation en texte intégral et la classification de textes. Dans la seconde partie, la recherche d’information est appréhendée comme une activité humaine et sociale : les connaissances linguistiques sont utilisées pour favoriser l’accès aux documents et permettre diverses activités informationnelles (lire, écrire, annoter, partager, etc.). Ce mémoire témoigne d’un parcours qui traverse les deux grandes conceptions de l’information. La première est inspirée du courant nord-américain de l’information retrieval qui cherche à établir des principes généraux de l’information, les technologies qui permettent de la traiter et de la rendre accessible. La seconde est inspirée de courants en sciences humaines et sociales (information seeking notamment) et donne la primeur aux usages de l’information et aux pratiques informationnelles dans des contextes socio-professionnels précis

Hal - Université Grenoble Alpes

L’organisation des connaissances au prisme du langage, du texte et du discours. Un parcours en recherche d’information.

Author: Clavier Viviane
Publication venue: HAL CCSD
Publication date: 10/03/2014
Field of study

Thèses en Ligne

Hal - Université Grenoble Alpes

HAL Descartes

L'AIS : une donnée pour l'analyse des activités en mer

Author: Brosset David
Le Guyader Damien
Publication venue: HAL CCSD
Publication date: 23/09/2013
Field of study

4 pages, session "Mer et littoral"International audienceCette contribution présente des éléments méthodologiques pour la description des activités humaines en mer dans une perspective d'aide à la gestion. Différentes procédures, combinant l'exploitation de bases de données spatio-temporelles issue de données AIS archivées à des analyses spatiales au sein d'un SIG, sont testées afin de caractériser le transport maritime en Mer d'Iroise (Bretagne, France) sur les plans spatiaux, temporels et quantitatifs au cours d'une année

HAL - Normandie Université

HAL-Université de Bretagne Occidentale

HAL Descartes

Oskar Bordeaux

Configuration interactive et contraintes : connaissances, filtrage et extensions

Author: Vareilles Élise
Publication venue: HAL CCSD
Publication date: 24/11/2015
Field of study

The value of our research work is rooted in the following observations :-1- the life cycle of products, systems, services and processes is tending to get shorter ; -2- new designs and updates of products on the market are becoming more and more frequent, leading to increasingly short design cycles ; -3 technologies are constantly changing, requiring permanent, ongoing acquisition of knowledge ; -4-the diversity of products offered on the market is growing all the time, ranging from customizable or configurable to made-to-measure or designed to order.These trends, and the mass of information and knowledge that requires treating as a result of them, are placing heavy demands on designers, requiring ever more attentiveness and increasingly intense cognitive effort. The result is an increased risk that the product does not fully meet the customer’s needs, that it is difficult to implement or manufacture, or that it will be prohibitively expensive. The aim of our work is thus to help the design process to reduce these risks and errors by delivering software tools and methodological environments that serve to capitalize and exploit general, contextual, academic, expert or business knowledge.Our work on various complex industrial cases has led us to take into consideration two kinds of knowledge, involving on the one hand the "product domain" and on the other the "product diversity element". Each kind of knowledge leads to differing industrial cases. The first kind of knowledge encompasses the scientific and technical aspects, but also the specific rules governing the business in question. This knowledge is required in order to define the product itself, and involves issues that can be resolved by aiding the product /system/service design. The second kind of knowledge relates to the diverse nature of the products, and involves issues of customization or configuration of the product/system/service.Our aim is to help in what might be called "routine" design, where different kinds and various types of knowledge exist, due to the recurrent nature of the activity. We consider that aid in design or configuration can be formalized, either completely or partially, in the form of a constraint satisfaction problem (CSP). In this context, we focus more specifically on interactive decision-support, by introducing the principles of filtering or constraint propagation. The diversity of knowledge formalized as a CSP and the interaction with the user allow us to assemble and adapt filtering algorithms in a generic constraint propagation engine, integrated in our CoFiADe software solution.In addition, this formalism based on CSP constraints is complemented by : - ontologies to structure knowledge and facilitate its reuse throughout the development cycle, - analogy-based approaches taking advantage of contextual knowledge encapsulated in the case under study, so as to make recommendations to the user on the choice of values, - evolutionary approaches to optimize the search for multi-criteria solutions.Les travaux de recherche présentés dans ce mémoire trouvent leurs fondements dans les constats suivants :-1- la durée de vie des produits et systèmes tend à se réduire,-2- les conceptions et les actualisations des produits mis sur le marché sont de plus en plus fréquentes alors que les cycles de conception sont toujours plus brefs,-3- les technologies employées en constante évolution nécessitent une acquisition de connaissance permanente,-4- la diversité des produits offerte sur les marchés ne cesse de croître allant des produits personnali- sables ou configurés jusqu’aux produits sur-mesure et conçus à la commande.Ces tendances et la masse d’informations et de connaissances à traiter en découlant exigent des concepteurs toujours plus d’attention et un travail cognitif toujours plus intense. Il en résulte une augmentation des risques, que le produit réponde imparfaitement aux besoins du demandeur, qu’il soit difficilement réalisable et fabricable, ou encore qu’il le soit à un coût prohibitif. L’objectif de nos travaux est donc de limiter ces risques et erreurs en proposant des outils logiciels et des environnements méthodologiques destinés à capitaliser et exploiter des connaissances générales, contextuelles, académiques, expertes ou métier pour aider la conception.Les travaux effectués sur différentes problématiques industrielles ont conduit à prendre en considération deux natures de connaissances relevant du « domaine produit » et de la « diversité produit » conduisant à des problématiques industrielles différentes : la première nature de connaissance recouvre aussi bien des aspects scientifiques et techniques que des règles métier, elle est nécessaire pour la définition du produit et débouche sur des problématiques d’aide à la conception de produit ; la seconde nature est une connaissance liée à la diversité des produits, qui débouche sur les problématiques d’aide à la personnalisation ou configuration de produit.Nous visons à aider un type de conception plutôt « routinier » où de la connaissance de différentes natures et de divers types existe du fait de la récurrence de l’activité. Nous considérons de plus dans nos travaux que l’aide à la conception ou configuration peut se formaliser, complètement ou partiellement, comme un problème de satisfaction de contraintes (CSP). Dans ce cadre, nous nous intéressons plus spécifiquement à l’aide à la décision interactive exploitant les principes de filtrage ou de propagation de contraintes. Notre objectif se décline alors en l’accompagnement des concepteurs dans la construction des solutions répondant au mieux à leurs problèmes, en retirant progressivement de l’espace des solutions, celles qui ne sont plus cohérentes avec les décisions prises, en estimant celles-ci au fil de leur construction et/ou en les optimisant.en complément, nous associons à ce formalisme à base de contraintes CSP :- des ontologies pour structurer les connaissances et faciliter leur réutilisateion sur l’ensemble du cycle de développement,- des approches par analogie exploitant de la connaissance contextuelle encapsulée dans des cas afin de proposer à l’utilisateur des recommandations quant aux choix de valeurs,- des approches évolutionnaires pour optimiser la recherche des solutions de manière multicritère

Thèses en Ligne

Du besoin d'informations à la formulation des requêtes : étude des usages de différents types d'utilisateurs visant l'amélioration d'un système de recherche d'informations

Author: Latour Marilyne
Publication venue: HAL CCSD
Publication date: 24/06/2014
Field of study

With the massive and heterogeneous web document collections, IR system must analyze the behaviors of users which are unpredictable and varied. The approach described in this thesis provides a comparison of the verbalizations for both natural language and web query for the same information need by the same user. For this, we used data collected (i.e. users' complaints in natural language and web queries) through a search engine dedicated to economic reports in French over 5 consecutive years totaling a corpus of 1398 natural language requests and 3427 web queries. Then, we compared the expression of the information need and highlighted the contributions in terms of information and clarification, the use of either language used.Devant des collections massives et hétérogènes de données, les systèmes de RI doivent désormais pouvoir appréhender des comportements d'utilisateurs aussi variés qu'imprévisibles. L'objectif de notre travail est d'évaluer la façon dont un même utilisateur verbalise un besoin informationnel à travers un énoncé de type « expression libre » (appelé langage naturel) et un énoncé de type mots-clés (appelé langage de requêtes). Pour cela, nous nous situons dans un contexte applicatif, à savoir des demandes de remboursement des utilisateurs d'un moteur de recherche dédié à des études économiques en français. Nous avons recueilli via ce moteur, les deux types d'énoncés sur 5 années consécutives totalisant un corpus de 1398 demandes en langage naturel et de 3427 requêtes. Nous avons alors comparé l'expression en tant que tel du besoin informationnel et mis en avant ce qu'apportait, en termes d'informations et de précisions, le recours à l'un ou l'autre du langage utilisé

Thèses en Ligne

Hal - Université Grenoble Alpes