37 research outputs found

    Random simulations of a datatable for efficiently mining reliable and non-redundant itemsets

    Get PDF
    International audienceOur goal is twofold: 1) we want to mine the only statistically valid 2-itemsets out of a boolean datatable, 2) on this basis, we want to build the only higher-order non-redundant itemsets compared to their sub-itemsets. For the first task we have designed a randomization test (Tournebool) respectful of the structure of the data variables and independant from the specific distributions of the data. In our test set (959 texts and 8477 terms), this leads to a reduction from 126, 000 2-itemsets to 13, 000 significant ones, at the 99% confidence interval. For the second task, we have devised a hierarchical stepwise procedure (MIDOVA) for evaluating the residual amount of variation devoted to higher-order itemsets, yielding new possible positive or negative high-order relations. On our example, this leads to counts of 7,712 for 2-itemsets to 3 for 6-itemsets, and no higher-order ones, in a computationally efficient way

    Early changes in rat diaphragm biology with mechanical ventilation

    Get PDF
    To better characterize the effects of 24-hour mechanical ventilation on diaphragm, the expression of myogenic transcription factors, myosin heavy chains, and sarcoplasmic/endoplasmic reticulum calcium-ATPase pumps was examined in rats. In the diaphragm of mechanically ventilated animals, the mRNA of MyoD, myosin heavy chain-2a and -2b, and sarcoplasmic/endoplasmic reticulum calcium-ATPase-1a decreased, whereas myogenin mRNA increased. In the diaphragm of anesthetized and spontaneously breathing rats, only the mRNA of MyoD and myosin heavy chain-2a decreased. MyoD and myogenin protein expression followed the changes at the mRNA, whereas the myosin heavy chain isoforms did not change. Parallel experiments involving the gastrocnemius were performed to assess the relative contribution of muscle shortening versus immobilization-induced deconditioning on muscle regulatory factor expression. Passive shortening produced no additional effects compared with immobilization-induced deconditioning. The overall changes followed a remarkably similar pattern except for MyoD protein expression, which increased in the gastrocnemius and decreased in the diaphragm while its mRNA diminished in both muscles. The early alterations in the expression of muscle protein and regulatory factors may serve as underlying molecular basis for the impaired diaphragm function seen after 24 hours of mechanical ventilation. Whether immobilization-induced deconditioning and/or passive shortening play a role in these alterations could not be fully unraveled

    Analyse comparative de classifications : apport des règles d'association floues

    Get PDF
    International audienceNotre travail s'appuie sur l'analyse d'un corpus bibliographique dans le domaine de la géotechnique à l'aide de cartes réalisées avec la plateforme Stanalyst®. Celui-ci intègre un algorithme de classification automatique non hiérarchique (les K-means axiales) donnant des résultats dépendant du nombre de classes demandé. Cette instabilité rend difficile toute comparaison entre classifications, et laisse un doute quant au choix du nombre de classes nécessaire pour représenter correctement un domaine. Nous comparons les résultats de classifications selon 3 protocoles : (1) analyse des intitulés des classes ; (2) relations entre les classes à partir des membres communs ; (3) règles d'association floues. Les graphes obtenus présentant des similitudes remarquables, nous privilégions les règles d'association floues : elles sont extraites automatiquement et se basent sur la description des classes et non des membres. Ceci nous permet donc d'analyser des classifications issues de corpus différents

    Paving the way for next generation data-stream clustering: towards a unique and statistically valid cluster structure at any time step

    Get PDF
    International audienceIn the domain of data-stream clustering, e.g., dynamic text mining as our application domain, our goal is two-fold and a long term one: 1 at each data input, the resulting cluster structure has to be unique, independent of the order the input vectors are presented 2 this structure has to be meaningful for an expert, e.g., not composed of a huge 'catch-all' cluster in a cloud of tiny specific ones, as is often the case with large sparse data tables. The first preliminary condition is satisfied by our Germen density-mode seeking algorithm, but the relevance of the clusters vis-à-vis expert judgment relies on the definition of a data density, relying itself on the type of graph chosen for embedding the similarities between text inputs. Having already demonstrated the dynamic behaviour of Germen algorithm, we focus here on appending a Monte-Carlo method for extracting statistically valid inter-text links, which looks promising applied both to an excerpt of the Pascal bibliographic database, and to the Reuters-RCV1 news test collection. Though not being a central issue here, the time complexity of our algorithms is eventually discussed

    Aide à l'interprétation des règles d'association composées.

    Get PDF
    International audienceL'extraction des règles d'association (RA) est une méthode qui est apparue pour les données type « tickets de caisse ». La création de nombreux indices de qualité a permis sa généralisation à d'autres types de données (Guil-let 2004). Nous nous intéressons ici au problème de l'expert qui se trouve confronté à un nombre important de règles pas toujours faciles à interpréter. Les règles formées seulement de deux propriétés, une en partie gauche et une en partie droite s'interprètent aisément une fois l'indice de qualité choisi. Dans le cas de règles composées, c'est-à-dire comportant plus de deux propriétés, ces indices ne suffisent pas à aider l'expert à interpréter le lien entre ces pro-priétés. Nous proposons un modèle qui permet d'évaluer le gain d'information apporté par les règles de type AB→C et de sélectionner pour l'expert celles qui ajoutent du sens aux règles simples A→C et B→C. L'application de cette mé-thodologie dans le cadre d'une analyse d'un corpus de textes par classification montre l'aide apportée à l'expert pour l'interprétation de cette classification. Pour faciliter l'exposé, le gain d'information que nous définissons a été appli-qué à des règles formées de 3 propriétés, mais il est défini pour un nombre quelconque de propriétés

    Règles d'association avec une prémisse composée : Mesure du gain d'information.

    Get PDF
    International audienceLa communauté de fouille de données a développé un grand nombre d'indices permettant de mesurer la qualité des règles d'association (RA) selon diverses sémantiques (Guillet, 2004). Cependant ces sémantiques, qui permettent d'interpréter les règles simples, s'avèrent d'utilisation trop complexe pour un expert dans le cas de règles à prémisse composée. Notre objectif est donc de sélectionner les règles à prémisse composée de type AB→C qui apportent une information supplémentaire à celle des règles simples A→C et B→C. Pour cela nous définissons un indice de gain d'une règle composée par rapport aux règles simples. Dans l'application présentée, nous extrayons des RA de résultats de classifications pour en faciliter l'analyse . Le gain a permis de filtrer des règles d'interprétation simple

    Treatment of canine atopic dermatitis: 2015 updated guidelines from the International Committee on Allergic Diseases of Animals (ICADA)

    Get PDF
    Background: In 2010, the International Task Force on Canine Atopic Dermatitis (now International Committee on Allergic Diseases of Animals, ICADA) published the first consensus guidelines for the treatment of atopic dermatitis (AD) in dogs. This is the first 5-year minor update of this document. Results: The treatment of acute flares of AD should involve the search for, and then elimination of, the cause of the flares, bathing with mild shampoos, and controlling pruritus and skin lesions with interventions that include topical and/or oral glucocorticoids or oclacitinib. For chronic canine AD, the first steps in management are the identification and avoidance of flare factors, as well as ensuring that there is adequate skin and coat hygiene and care;this might include more frequent bathing and possibly increasing essential fatty acid intake. The medications currently most effective in reducing chronic pruritus and skin lesions are topical and oral glucocorticoids, oral ciclosporin, oral oclacitinib, and, where available, injectable recombinant interferons. Allergen-specific immunotherapy and proactive intermittent topical glucocorticoid applications are the only interventions likely to prevent or delay the recurrence of flares of AD. Conclusions: This first 5-year minor update of the international consensus guidelines for treatment of AD in dogs further establishes that the treatment of this disease is multifaceted, and that interventions should be combined for a proven (or likely) optimal benefit. Importantly, treatment plans are likely to vary between dogs and, for the same dog, between times when the disease is at different stages

    Document stream clustering : experimenting an incremental algorithm and AR-based tools for highlighting dynamic trends

    Get PDF
    We address here two major challenges presented by dynamic data mining: 1) the stability challenge: we have implemented a rigorous incremental density-based clustering algorithm, independent from any initial conditions and ordering of the data-vectors stream, 2) the cognitive challenge: we have implemented a stringent selection process of association rules between clusters at time t-1 and time t for directly generating the main conclusions about the dynamics of a data-stream. We illustrate these points with an application to a two years and 2600 documents scientific information database

    Suivi incrémental des évolutions dans une base d'information indexée : une boucle évaluation / correction pour le choix des algorithmes et des paramètres.

    No full text
    International audienceNous avons conçu et implanté l'environnement Germen de clustering incrémental d'une base d'information indexée, à partir d'un flux de vecteurs-données. Cet environnement nécessite 1) la définition et la mise à jour du graphe des liens entre ces vecteurs, 2) le paramétrage de notre méthode de clustering par densité (définition de la densité, règle de propagation des frontières de clusters, ...). Pour tendre vers des résultats satisfaisants quelles que soient la nature et l'échelle des données, il s'est avéré nécessaire de mettre en place une boucle : évaluation par un expert du domaine / correction des paramètres ou choix des algorithmes. En effet une extraction des tendances dans le temps doit s'appuyer sur des « photos » à la fois stables et exactes, conformes à l'expertise humaine sur les données, alors que ces deux qualités se sont révélées souvent contradictoires. Nous présentons ce processus à l'oeuvre sur un extrait de la base Pascal (CNRS/INIST) relatif à la recherche en géotechnique, et sur un corpus de test public (23 000 dépêches Reuters)
    corecore