2,772 research outputs found

    Recherche de motifs et cartographie des surfaces agricoles. Des relevés terrain aux données satellitaires : application au Mali

    Get PDF
    International audienceLa cartographie automatique de territoires ruraux est un outil essentiel dans le contexte sociétal actuel (e.g., analyse des risques de famine, étude des risques liés à la déforestation). Dans cet article, nous présentons une approche préliminaire de caractérisation des paysages ruraux et de leurs systèmes de culture à partir de techniques de fouille de données (recherche d'itemsets fréquents). Cette méthode permet de coupler des données de relevés terrain aux indicateurs extraits des images satellitaires. Cette approche a été mise en ½uvre sur des données associées au Mali en collaboration avec des experts du domaine posant les premières bases d'une méthode originale d'extraction de motifs à partir de données complexes. / Countryside automatic cartography is a real and decisive challenge in the current societal context (e.g., the famine risk analysis, the deforestation consequence analysis). In this paper, we propose a preliminary approach allowing the landscape characterization. More precisely, an itemset-based-technique is developed to extract crop types features. One of the main strengths of the proposed methodology is to combine both indicators extracted from satellite image and data collected from a site survey. The approach was run on data associated to Mali in collaboration with some domain experts

    Quels sont les patients atteints d'un cancer du sein dont la décision de prise en charge thérapeutique bénéficie de l'utilisation d'un système d'aide à la décision ? Un exemple utilisant la fouille de données et OncoDoc2

    Get PDF
    Session 2 : Utilisateurs et usagesNational audienceOncoDoc2 est un système d'aide à la décision (SAD) s'appuyant sur des recommandations de pratique clinique (RPC) pour la prise en charge des cancers du sein. Il a été utilisé comme intervention dans un essai randomisé contrôlé dont l'objectif principal était d'évaluer son impact sur la conformité des décisions des réunions de concertation pluridisciplinaire aux RPC. Nous avons utilisé un algorithme de fouille de données pour découvrir les régularités des profils patients, ou " motifs émergents " (ME), associées à la conformité et à la non-conformité des décisions selon que le système OncoDoc2 était ou non utilisé, afin d'évaluer quels profils patients pouvaient bénéficier de l'utilisation du système. Les ME associés à la non conformité des décisions prises sans le système sont associées à la conformité quand le système est utilisé sauf dans certaines situations cliniques pour lesquelles la force de la recommandation est faible

    Traitement automatique des données hétérogènes liées à l'aménagement des territoires

    Get PDF
    National audienceLa notion d'aménagement du territoire fait référence à différents concepts tels que les informations spatiales et temporelles, les acteurs, les opinions, l'histoire, la politique, etc. Aujourd'hui, avec le développement des technologies numériques (blogs, forums, réseaux sociaux, etc.), l'ensemble des acteurs impliqués s'expriment et tous les documents textuels ainsi produits constituent une source considérable d'informations qu'il est crucial d'analyser. Dans cet article, nous souhaitons poser les premières bases d'une méthode automatique d'extraction de connaissances permettant d'analyser le ressenti (opinion et/ou sentiment) des acteurs impliqués à partir d'un corpus de données totalement hétérogènes constitués spécifiquement pour un territoire. Une telle approche, qui se situe dans le domaine de la science des données, offrira aux décideurs et aux usagers d'un territoire un environnement leur permettant d'en obtenir les clefs de lecture et d'en mesurer tous les enjeux et les contours

    Fouille visuelle de données temporelles avec DataTube2

    Get PDF
    International audienceNous nous intéressons dans cet article à la fouille visuelle de données temporelles, où les données ont été mises sous la forme de n attributs dont les valeurs sont enregistrées pendant k instants. Après un état de l'art sur les différentes approches de visualisation de telles séries, nous présentons plus particulièrement une approche ayant reçue encore peu d'attention ("DataTube"). DataTube place les données dans un tube dont l'axe représente le temps. Nous étendons ensuite cette approche : tout d'abord nous définissons plusieurs modes de visualisations (couleurs, formes, etc) et nous ajoutons un axe temporel. Ensuite nous introduisons des interactions avec la possibilité de sélectionner des attributs et des instants, afficher des données complexes ou encore insérer des annotations sur la visualisation. Nous ajoutons une étape de classification non supervisée afin de regrouper dans la visualisation les attributs similaires. Enfin nous intégrons cette visualisation dans notre plateforme de fouille de données en réalité virtuelle VRMiner, avec un affichage stéréoscopique et des possibilités de navigation interactive. Nous appliquons cette visualisation sur plusieurs ensembles de données réelles et nous montrons qu'elle peut gérer jusqu'à 1,5 million de valeurs. Nous présentons également une évaluation utilisateur

    Enrichissement de schéma multidimensionnel en constellation grâce à la Classification Ascendante Hiérarchique

    No full text
    National audienceLes hiérarchies sont des structures cruciales dans un entrepôt de don-nées puisqu'elles permettent l'agrégation de mesures dans le but de proposer une vue analytique plus ou moins globale sur les données entreposées, selon le niveau hiérarchique auquel on se place. Cependant, peu de travaux s'intéressent à la construction de hiérarchies, via un algorithme de fouille de données, pre-nant en compte le contexte multidimensionnel de la dimension concernée. Dans cet article, nous proposons donc un algorithme, implémenté sur une architecture ROLAP, permettant d'enrichir une dimension avec des données factuelles

    Utilisation d'outils de Visual Data Mining pour l'exploration d'un ensemble de règles d'association

    Get PDF
    International audienceData Mining aims at extracting maximum of knowledge from huge databases. It is realized by an automatic process or by data visual exploration with interactive tools. Automatic data mining extracts all the patterns which match a set of metrics. The limit of such algorithms is the amount of extracted data which can be larger than the initial data volume. In this article, we focus on association rules extraction with Apriori algorithm. After the description of a characterization model of a set of association rules, we propose to explore the results of a Data Mining algorithm with an interactive visual tool. There are two advantages. First it will visualize the results of the algorithms from different points of view (metrics, rules attributes). Then it allows us to select easily inside large set of rules the most relevant ones

    Une nouvelle approche mixte d'enrichissement de dimensions dans un schéma multidimensionnel en constellation Application à la biodiversité des oiseaux

    No full text
    International audienceLes entrepôts de données (DW) et les systèmes OLAP sont des technologies d'analyse en ligne pour de grands volumes de données, basés sur les be-soins des utilisateurs. Leur succès dépend essentiellement de la phase de conception où les exigences fonctionnelles sont confrontées aux sources de données (méthodologie de conception mixte). Cependant, les méthodes de conception existantes semblent parfois inefficaces, lorsque les décideurs définissent des exi-gences fonctionnelles qui ne peuvent être déduites à partir des sources de don-nées (approche centrée sur les données), ou lorsque le décideur n'a pas intégré tous ces besoins durant la phase de conception (approche centrée sur l'utilisa-teur). Cet article propose une nouvelle méthodologie mixte d'enrichissement de schémas en constellation, où l'approche classique de conception est améliorée grâce à la fouille de données dans le but de créer de nouvelles hiérarchies au sein d'une dimension. Un prototype associé est également présenté
    corecore