Search CORE

2,139 research outputs found

Quels sont les patients atteints d'un cancer du sein dont la décision de prise en charge thérapeutique bénéficie de l'utilisation d'un système d'aide à la décision ? Un exemple utilisant la fouille de données et OncoDoc2

Author: Blaszka-Jaulerry Brigitte
Bouaud Jacques
Cojean-Zelek Isabelle
Durieux Axel
Lefranc Jean-Pierre
Messai Nizar
Rousseau Alexandra
Soulet Arnaud
Spano Jean-Philippe
Séroussi Brigitte
Tournigand Christophe
Zelek Laurent
Publication venue: HAL CCSD
Publication date: 12/05/2014
Field of study

Session 2 : Utilisateurs et usagesNational audienceOncoDoc2 est un système d'aide à la décision (SAD) s'appuyant sur des recommandations de pratique clinique (RPC) pour la prise en charge des cancers du sein. Il a été utilisé comme intervention dans un essai randomisé contrôlé dont l'objectif principal était d'évaluer son impact sur la conformité des décisions des réunions de concertation pluridisciplinaire aux RPC. Nous avons utilisé un algorithme de fouille de données pour découvrir les régularités des profils patients, ou " motifs émergents " (ME), associées à la conformité et à la non-conformité des décisions selon que le système OncoDoc2 était ou non utilisé, afin d'évaluer quels profils patients pouvaient bénéficier de l'utilisation du système. Les ME associés à la non conformité des décisions prises sans le système sont associées à la conformité quand le système est utilisé sauf dans certaines situations cliniques pour lesquelles la force de la recommandation est faible

HAL-Inserm

HAL Descartes

HAL Université de Tours

HAL-Paris 13

Traitement automatique des données hétérogènes liées à l'aménagement des territoires

Author: Roche Mathieu
Teisseire Maguelonne
Publication venue: HAL CCSD
Publication date: 01/01/2015
Field of study

National audienceLa notion d'aménagement du territoire fait référence à différents concepts tels que les informations spatiales et temporelles, les acteurs, les opinions, l'histoire, la politique, etc. Aujourd'hui, avec le développement des technologies numériques (blogs, forums, réseaux sociaux, etc.), l'ensemble des acteurs impliqués s'expriment et tous les documents textuels ainsi produits constituent une source considérable d'informations qu'il est crucial d'analyser. Dans cet article, nous souhaitons poser les premières bases d'une méthode automatique d'extraction de connaissances permettant d'analyser le ressenti (opinion et/ou sentiment) des acteurs impliqués à partir d'un corpus de données totalement hétérogènes constitués spécifiquement pour un territoire. Une telle approche, qui se situe dans le domaine de la science des données, offrira aux décideurs et aux usagers d'un territoire un environnement leur permettant d'en obtenir les clefs de lecture et d'en mesurer tous les enjeux et les contours

HAL Descartes

Agritrop

HAL-CIRAD

La fouille de textes au service de la documentation

Author: Fortuno Sophie
Roche Mathieu
Publication venue: 'Babes-Bolyai University'
Publication date: 01/01/2014
Field of study

Article de vulgarisation scientifiqueNational audienceLes masses de données textuelles aujourd'hui disponibles engendrent un problème spécifique lié à leur traitement automatique. Des méthodes de fouille de textes et de traitement automatique du langage peuvent en partie répondre à cette difficulté. Approche des procédés et des nouveaux défis à relever présentés par deux chercheurs du Cirad, centre de recherche français qui répond, avec les pays du Sud, aux enjeux internationaux de l'agriculture et du développement

HAL Descartes

HAL-CIRAD

Enrichissement de schéma multidimensionnel en constellation grâce à la Classification Ascendante Hiérarchique

Author: Bimonte Sandro
Faivre Bruno
Journaux Ludovic
Larrère Arnaud
Saint paul Kevin
Sautot Lucile
Publication venue: HAL CCSD
Publication date: 18/01/2016
Field of study

National audienceLes hiérarchies sont des structures cruciales dans un entrepôt de don-nées puisqu'elles permettent l'agrégation de mesures dans le but de proposer une vue analytique plus ou moins globale sur les données entreposées, selon le niveau hiérarchique auquel on se place. Cependant, peu de travaux s'intéressent à la construction de hiérarchies, via un algorithme de fouille de données, pre-nant en compte le contexte multidimensionnel de la dimension concernée. Dans cet article, nous proposons donc un algorithme, implémenté sur une architecture ROLAP, permettant d'enrichir une dimension avec des données factuelles

HAL-uB

HAL

Hal-Diderot

Fouille de données pour associer des noms de sessions aux articles scientifiques

Author: Cellier Peggy
Charnois Thierry
Quiniou Solen
Publication venue: HAL CCSD
Publication date: 01/07/2014
Field of study

National audienceIn this paper, we present a proposition based on data mining to tackle the DEFT 2014 challenge. We focus on task 4 which consists of identifying the right conference session for scientific papers. The proposed approach is based on a combination of two data mining techniques. Sequence mining extracts frequent phrases in scientific papers in order to build paper and session descriptions. Then, those descriptions of papers and sessions are used to create a graph which represents shared descriptions. A graph mining technique is applied on the graph in order to extract a collection of homogenous sub-graphs corresponding to sets of papers associated to sessions.Nous décrivons dans cet article notre participation à l'édition 2014 de DEFT. Nous nous intéressons à la tâche consistant à associer des noms de session aux articles d'une conférence. Pour ce faire, nous proposons une approche originale, symbolique et non supervisée, de découverte de connaissances. L'approche combine des méthodes de fouille de données séquentielles et de fouille de graphes. La fouille de séquences permet d'extraire des motifs fréquents dans le but de construire des descriptions des articles et des sessions. Ces descriptions sont ensuite représentées par un graphe. Une technique de fouille de graphes appliquée sur ce graphe permet d'obtenir des collections de sous-graphes homogènes, correspondant à des collections d'articles et de noms de sessions

HAL-CentraleSupelec

INRIA a CCSD electronic archive server

HAL-Paris 13

Hal-Diderot

HAL-Rennes 1

Data Science : une formation internationale de niveau Master en science des données

Author: Amini Massih-Reza
Durand Jean-Baptiste
Gaudoin Olivier
Gaussier Eric
Juditsky Anatoli,
Publication venue: Société Française de Statistique
Publication date: 01/06/2016
Field of study

International audienceWe present the international training program in Data Science at master 2 level. This program is supported by both Grenoble Alpes University and Grenoble INP. In this article, we elaborate on the specific features of the program, its strategic position, operating and historical features, the detailed contents of courses and perspectives of evolution.Nous présentons la formation internationale de niveau master 2 en Data Science de l'Université Grenoble Alpes et de Grenoble INP : spécificités et positionnement de la formation, fonctionnement et aspects historiques de sa création, programme de cours détaillé et perspectives d'évolution

Hal - Université Grenoble Alpes

INRIA a CCSD electronic archive server

HAL Descartes

HAL-CIRAD

La confiance est dans l'air ! Application à l'identification des parcours hospitaliers

Author: Azé Jérôme
Bringay Sandra
Mercadier Yves
Pinaire Jessica
Teisseire Maguelonne
Publication venue: HAL CCSD
Publication date: 19/01/2016
Field of study

National audienceL'extraction de motifs séquentiels permet d'identifier les séquences fréquentes d'événements ordonnés. Afin de résoudre le problème du grand nombre de motifs obtenus, nous proposons l'extension pour les motifs séquentiels de la confiance, mesure d'intérêt utilisée classiquement pour sélectionner les règles d'association. Dans cet article, après avoir présenté les données, nous définirons formellement la notion de confiance appliquée aux motifs séquentiels. Nous appliquerons cette mesure pour identifier des trajectoires hospitalières, représentées par les motifs séquentiels, dans des données issues du PMSI (Programme de Médicalisation des Systèmes d'Information). Nous nous sommes focalisés sur un cas d'étude hospitalière : l'infarctus du myocarde (IM), et notamment la prédiction de la trajectoire des patients ayant eu un IM entre 2009 et 2013. Les résultats obtenus ont été soumis à un spécialiste pour discussion et validation

HAL Descartes

HAL-CIRAD