114 research outputs found

    Descendant hierarchical support vector machine for multi-class problems

    No full text
    International audienc

    Contributions en apprentissage semi-supervisé: Modélisation, Classification et Sélection

    No full text
    L’ensemble des activités de recherche décrites dans cette HDR s’inscrit dans le cadre de l’apprentissage semi-supervisé, au sens large, pour l’extraction de connaissances à partir de données. Dans cette thématique, on s’intéresse à l’analyse de données partiellement étiquetées qui peut être abordée selon deux grandes familles d’approches. La première est basée sur la propagation de la "supervision", en vue de l’apprentissage supervisé. La seconde est fondée sur la transformation des données étiquetées en contraintes pour leur intégration dans un processus non-supervisé. Les travaux de cette HDR s’inscrivent dans la deuxième famille d’approches avec une difficulté particulière. Il s’agit d’apprendre à partir de données dont la partie étiquetée est relativement réduite par rapport à la partie non-étiquetée. Pour ce faire, je me suis particulièrement intéressé aux modèles topologiques basés sur les cartes auto-organisatrices d’une part, et aux modèles graphiques basés sur la coloration et l’analyse spectrale de graphes d’autre part. M’appuyant sur ces modèles, j’ai essayé de répondre à plusieurs questions qui sont souvent posées dans les communautés d’apprentissage automatique et de fouille de données, et qui demeurent toujours d’actualité. Les réponses à ces questions se traduisent par quelques contributions qui constituent le cœur de cette HDR : (1) modélisation graphique des cartes topologiques, (2) classification topologique sous contraintes et (3) sélection de variables en mode semi-supervisé

    Contributions en apprentissage semi-supervisé: Modélisation, Classification et Sélection

    No full text
    L’ensemble des activités de recherche décrites dans cette HDR s’inscrit dans le cadre de l’apprentissage semi-supervisé, au sens large, pour l’extraction de connaissances à partir de données. Dans cette thématique, on s’intéresse à l’analyse de données partiellement étiquetées qui peut être abordée selon deux grandes familles d’approches. La première est basée sur la propagation de la "supervision", en vue de l’apprentissage supervisé. La seconde est fondée sur la transformation des données étiquetées en contraintes pour leur intégration dans un processus non-supervisé. Les travaux de cette HDR s’inscrivent dans la deuxième famille d’approches avec une difficulté particulière. Il s’agit d’apprendre à partir de données dont la partie étiquetée est relativement réduite par rapport à la partie non-étiquetée. Pour ce faire, je me suis particulièrement intéressé aux modèles topologiques basés sur les cartes auto-organisatrices d’une part, et aux modèles graphiques basés sur la coloration et l’analyse spectrale de graphes d’autre part. M’appuyant sur ces modèles, j’ai essayé de répondre à plusieurs questions qui sont souvent posées dans les communautés d’apprentissage automatique et de fouille de données, et qui demeurent toujours d’actualité. Les réponses à ces questions se traduisent par quelques contributions qui constituent le cœur de cette HDR : (1) modélisation graphique des cartes topologiques, (2) classification topologique sous contraintes et (3) sélection de variables en mode semi-supervisé

    Un score Laplacien sous contraintes pour la sélection de variables en mode semi-supervisé

    No full text
    National audienceDans cet article, nous abordons le problème de la sélection de variables semi-supervisée à partir de données de grandes dimensions. Nous présentons une approche "filtre" combinant deux scores récemment proposés : Le score Laplacien et le score de contraintes. Nous évaluons la pertinence d'une variable selon sa capacité à préserver la structure géométrique d'une part et son pouvoir discriminant d'autre part. Le problème est ainsi expliqué dans le cadre de la théorie spectrale de des graphes. Enfin, des résultats expérimentaux seront fournis pour valider notre approche et la comparer avec d'autres méthodes représentatives de sélection de variables

    Optimizing local modeling for times series prediction

    No full text
    International audienc

    Sélection de variables en mode semi-supervisé dans un contexte multi-labels

    No full text
    National audienceDans cet article, nous proposons un cadre unifié pour la sélection de variables semi-supervisée dans un contexte multi-labels, en se basant sur le score Laplacien. En particulier, nous montrons comment contraindre la fonction de ce score, lorsque les données sont partiellement étiquetée et chaque instance est associée à un ensemble d'étiquettes, simultanément. Nous transformons la partie étiquetée des données en contraintes "relaxées" et montrons comment les intégrer dans une mesure de pertinence pour les variables, selon la disponibilité des étiquettes. Des expérimentations sur des ensembles de données de référence sont fournis pour valider l'approche proposée et la comparer avec d'autres méthodes de sélection de variables dans le contexte multi-labels

    Efficient semi-supervised feature selection: Constraint, Relevance and Redundancy.

    No full text
    International audienceThis paper describes a three-level framework for semi-supervised feature selection. Most feature selection methods mainly focus on finding relevant features for optimizing high-dimensional data. In this paper, we show that the relevance requires two important procedures to provide an efficient feature selection in the semi-supervised context. The first one concerns the selection of pairwise constraints that can be extracted from the labeled part of data. The second procedure aims to reduce the redundancy that could be detected in the selected relevant features. For the relevance, we develop a filter approach based on a constrained Laplacian score. Finally, experimental results are provided to show the efficiency of our proposal in comparison with several representative methods
    • …
    corecore