3 research outputs found

    Structuration de données par apprentissage non-supervisé : applications aux données textuelles

    Get PDF
    En fouille de données, le succès d'une méthode tient au fait qu'elle permet de répondre par un algorithme intuitif à un besoin pratique bien théorisé. C'est avec cet éclairage que nous présentons un ensemble de contributions, élaborées durant ces dix dernières années, et répondant au besoin pratique de structurer automatiquement un ensemble de données. Dans un premier temps nous proposons de nouveaux modèles théoriques de structuration complexe en classes d’individus ; il s’agit alors d'extraire automatiquement d'un ensemble de données, des structures de classification plus proches de leur organisation réelle telle qu’observée (classification recouvrante, formes symétriques), de rendre ces structures à la fois robustes (tolérance au bruit) et manipulables par l’homme (visualisation, paramétrage) et enfin d’être en mesure de les expliquer (sémantique des classes). Dans un second temps nous nous intéressons aux données textuelles via la mise en oeuvre de modèles rendant compte de la structure thématique d’une collection de textes courts dans un contexte de recherche d’information ; enfin, nous présentons un méta-modèle permettant d’apprendre automatiquement un modèle de structuration sémantique d’un ensemble de termes

    Les frontières dialectiques

    Get PDF
    Le but de cet article est de proposer, sous le terme générique de frontières dialectiques, une généralisation de la notion de frontière, notamment mieux adaptée aux « espaces discrets » que la définition topologique classique. Le cas des « espaces nets » est d’abord considéré puis, après un rappel des travaux récents concernant la formalisation des frontières floues, une typologie partielle des différentes définitions qu’on y trouve est proposée en s’appuyant sur les notions d’espaces dialectiques flous et d’espaces à frontières floues.Implicative statistical analysis expands the field of methods for processing the relationships between variables. In this sense, it represents an important advance in the realm of structural models applied to data. However, as with all processing models, its application in the social sciences poses difficult questions concerning the interpretation of results. Drawing upon the results of both previous and ongoing research, this article aims to evaluate the methodological difficulties of this model

    CONTRIBUTION À L'ANALYSE DES DONNÉES FLOUES

    Get PDF
    In many fields of science, the nature of data sometimes makes difficult the construction and analysis of data tables by the traditional methods of descriptive statistics. This is most often imprecise knowledge or waves that may be of a given phenomenon. If the question "How old are you? "We answer" about 30 years ", such a response can not be seen as a statistical character in the classic sense of the term. The problem arises here at all possible observations. This set is not clear, it is blurred. Hence the need to clarify the concept of fuzzy randomness, specifically fuzzy qualitative nature for which we propose an interpretation in terms of the subset. If the notion of probability seems appropriate to deal with uncertain events, that possibility is more appropriate when events are unclear.Dans plusieurs domaines de la science, la nature des données rend parfois difficile la construction et l'analyse des tableaux de données par les méthodes traditionnelles de la statistique descriptive. Il s'agit le plus souvent de connaissances imprécises ou vagues que l'on peut avoir d'un phénomène donné. Si à la question « quel âge avez-vous ? », l'on répond « environ 30 ans », une telle réponse ne peut pas être vue comme un caractère statistique au sens classique du terme. Le problème se pose ici au niveau de l'ensemble des observations possibles. Cet ensemble n'est pas net, il est flou. D'où la nécessité de préciser la notion de caractère statistique flou, et plus précisément de caractère qualitatif flou pour lequel nous proposons une interprétation en terme de sous-ensemble. Si la notion de probabilité semble appropriée pour traiter des événements incertains, celle de possibilité est plus indiquée quand les événements sont imprécis
    corecore