24 research outputs found

    Approches de théorie des graphes d'ordre supérieur pour diverses données omiques

    No full text
    This thesis presented conditional-random-field-based approaches for medical applications on diverse omics data. This methodology allowed leveraging more complex, structural information and notable assets from graph theory, particularly interesting to express intricate biological properties. We demonstrated their usefulness for clustering and feature selection towards classification. Their relevance was exemplified over several medical applications and omics data.First, we proposed a generic and resilient feature selection and classification pipeline we developed for COVID-19 patients staging and outcome prediction using only CT scans and clinical information. Relying on an automated segmentation technique, we extracted imaging information. After a required step of dimensionality reduction, we singled out few relevant factors for classification. We obtained promising performance outperforming radiologist experts on all the tasks. We further extended and adapted our methodology to cope with other different omics data, diseases, and medical expectations.Second, we focused on a clustering process towards the determination of a clinically relevant gene signature for pan-cancer lesions characterization. Oncology is a perfectly suited area for this kind of approach as tumors present a high heterogeneity while being a major affliction worldwide. Many studies are involved in its description through genomics. However, the task's complexity dwells in the data's large dimensionality and the experimental cost for identifying unknown gene functions. We highlighted our compact signature's relevance by resorting to unsupervised and supervised tumor types and subtypes distinction combined with statistically significant biological considerations.Finally, we formulated a new higher-order distance learning framework for feature selection and weighting, relying on conditional random fields and clustering. We proposed a mathematical optimization method for its resolution able to handle the high-order information complexity efficiently. Strong from this paradigm's expressiveness, we investigated the use of high-order graph theory properties as cliques, eccentricity, connectivity, or path lengths. We established those attributes' informativeness in classification settings and reported superior results than with standard approaches.Cette thèse introduit l’usage d’approches reposant sur les « conditional random fields » à diverses applications médicales et données omiques. Ces méthodes permettent de tirer parti au mieux d’informations structurelles lourdes à interpréter et analyser. En particulier, l’emploi de la théorie des graphes d’ordre supérieur revêt un intérêt majeur pour l’expression des relations biologiques complexes. Nous démontrons leur pertinence dans les domaines du « clustering » et de la sélection de variables pour la classification. Nous nous sommes appuyés sur plusieurs applications médicales et données omiques pour mettre ces résultats en lumière. Dans un premier temps, nous avons proposé un système générique et résilient de sélection de variables et de classification que nous avons développé pour déterminer la sévérité de la maladie de patients atteints de la COVID-19. Dans ce but, nous nous sommes appuyés sur des informations extraites de segmentations automatiques des organes et zones lésées que nous avons combinées avec des informations cliniques. Nous avons identifé un nombre restraint de facteurs déterminants la classification. Nous avons obtenu des performances prometteuses dépassant celles de radiologues experts sur les tâches considérées. Nous avons étendu plus avant et adapté cette méthodologie pour traiter d'autres données omiques, maladies et attendus médicaux. Par la suite, nous avons étudié un procédé de clustering pour la définition d'une signature de gènes présentant un intérêt clinique vis-à-vis de la caractérisation pan-cancer de lésions. Bien des études se sont essayées à la description du cancer grâce à la génomique. Cependant, la grande dimensionalité des données représente un formidable obstacle. Nous avons prouvé la pertinence de la signature génétique très compacte générée par notre méthode en recourrant à des approches supervisées et non-supervisées pour la caractérisation des types et sous-types de tumeurs. Finalement, nous avons défini une nouvelle approche d'apprentissage de distance d'ordre supérieur à visée de sélection et de pondération de variables. Fort de la grande expressivité de ce paradigme, nous avons exploré diverses propriétés de théorie des graphes d'ordre supérieur et avons établi que, dans le cadre d'une tâche de classification, ils possèdent une grande expressivité et permettent d'obtenir des résultats supérieurs à ceux des méthodes standards

    Approches de théorie des graphes d'ordre supérieur pour diverses données omiques

    No full text
    This thesis presented conditional-random-field-based approaches for medical applications on diverse omics data. This methodology allowed leveraging more complex, structural information and notable assets from graph theory, particularly interesting to express intricate biological properties. We demonstrated their usefulness for clustering and feature selection towards classification. Their relevance was exemplified over several medical applications and omics data.First, we proposed a generic and resilient feature selection and classification pipeline we developed for COVID-19 patients staging and outcome prediction using only CT scans and clinical information. Relying on an automated segmentation technique, we extracted imaging information. After a required step of dimensionality reduction, we singled out few relevant factors for classification. We obtained promising performance outperforming radiologist experts on all the tasks. We further extended and adapted our methodology to cope with other different omics data, diseases, and medical expectations.Second, we focused on a clustering process towards the determination of a clinically relevant gene signature for pan-cancer lesions characterization. Oncology is a perfectly suited area for this kind of approach as tumors present a high heterogeneity while being a major affliction worldwide. Many studies are involved in its description through genomics. However, the task's complexity dwells in the data's large dimensionality and the experimental cost for identifying unknown gene functions. We highlighted our compact signature's relevance by resorting to unsupervised and supervised tumor types and subtypes distinction combined with statistically significant biological considerations.Finally, we formulated a new higher-order distance learning framework for feature selection and weighting, relying on conditional random fields and clustering. We proposed a mathematical optimization method for its resolution able to handle the high-order information complexity efficiently. Strong from this paradigm's expressiveness, we investigated the use of high-order graph theory properties as cliques, eccentricity, connectivity, or path lengths. We established those attributes' informativeness in classification settings and reported superior results than with standard approaches.Cette thèse introduit l’usage d’approches reposant sur les « conditional random fields » à diverses applications médicales et données omiques. Ces méthodes permettent de tirer parti au mieux d’informations structurelles lourdes à interpréter et analyser. En particulier, l’emploi de la théorie des graphes d’ordre supérieur revêt un intérêt majeur pour l’expression des relations biologiques complexes. Nous démontrons leur pertinence dans les domaines du « clustering » et de la sélection de variables pour la classification. Nous nous sommes appuyés sur plusieurs applications médicales et données omiques pour mettre ces résultats en lumière. Dans un premier temps, nous avons proposé un système générique et résilient de sélection de variables et de classification que nous avons développé pour déterminer la sévérité de la maladie de patients atteints de la COVID-19. Dans ce but, nous nous sommes appuyés sur des informations extraites de segmentations automatiques des organes et zones lésées que nous avons combinées avec des informations cliniques. Nous avons identifé un nombre restraint de facteurs déterminants la classification. Nous avons obtenu des performances prometteuses dépassant celles de radiologues experts sur les tâches considérées. Nous avons étendu plus avant et adapté cette méthodologie pour traiter d'autres données omiques, maladies et attendus médicaux. Par la suite, nous avons étudié un procédé de clustering pour la définition d'une signature de gènes présentant un intérêt clinique vis-à-vis de la caractérisation pan-cancer de lésions. Bien des études se sont essayées à la description du cancer grâce à la génomique. Cependant, la grande dimensionalité des données représente un formidable obstacle. Nous avons prouvé la pertinence de la signature génétique très compacte générée par notre méthode en recourrant à des approches supervisées et non-supervisées pour la caractérisation des types et sous-types de tumeurs. Finalement, nous avons défini une nouvelle approche d'apprentissage de distance d'ordre supérieur à visée de sélection et de pondération de variables. Fort de la grande expressivité de ce paradigme, nous avons exploré diverses propriétés de théorie des graphes d'ordre supérieur et avons établi que, dans le cadre d'une tâche de classification, ils possèdent une grande expressivité et permettent d'obtenir des résultats supérieurs à ceux des méthodes standards

    Modélisation et Simulation de la diffusion d'opinions extrêmes

    No full text
    International audienceThis paper focuses on modelling and simulating diffusion of extreme opinions among agents. In this work, opinions are modelled as formulas of the propositional logic. Moreover, agents influence each other and any agent changes its current opinion by merging the opinions of its influencers, taking into account the strength of their influence. We propose several definitions of extreme opinions and extremism. Formal studies of these definitions are made as well as some simulations.Cet article s'intéresse à la modélisation et la simulation d'opinions extrêmes dans un réseau d'agents. Dans ce travail, les opinions sont modélisées par des formules de la logique propositionnelle et tout agent fait évoluer son opinion en fusionnant les opinions des agents qui l'influencent, en prenant en compte la force de cette influence. Dans cet article, nous proposons plusieurs définitions d'opinions extrêmes, nous analysons formellement ces définitions et présentons des résultats de simulation de diffusion d'opinions extrêmes

    GHOST: Graph Higher-Order Similarity Transformation for Classification

    No full text
    Exploring and identifying a good feature representation to describe large-scale datasets is one of the main problems of machine learning algorithms. However, plenty of feature selection techniques and distance metrics with very different properties exist, which entails an intricacy for identifying the proper method. This paper provides a general algorithm to design a high-order distance metric over a sparse selection of features dedicated to semi-supervised clustering and classification. We extend usual learning methods to design a metric accounting for patterns over sets of objects. Our approach is based on Conditional Random Field (CRF) energy minimization and Dual Decomposition, which allow efficiency and great flexibility in the features to consider. In particular, it enables to leverage the higher-order graph structures information efficiently. The optimization technique employed ensures the tractability of very high dimensionality problems using hundreds of features and samples. On a challenging task of Covid-19 patients stratification, we compare the classification results between state of the art baselines and our proposed classifier, relying on the higher-order distance learned to prove this metric formulation's relevance

    Deep learning based registration using spatial gradients and noisy segmentation labels

    Get PDF
    Image registration is one of the most challenging problems in medical image analysis. In the recent years, deep learning based approaches became quite popular, providing fast and performing registration strategies. In this short paper, we summarise our work presented on Learn2Reg challenge 2020. The main contributions of our work rely on (i) a symmetric formulation, predicting the transformations from source to target and from target to source simultaneously, enforcing the trained representations to be similar and (ii) integration of variety of publicly available datasets used both for pretraining and for augmenting segmentation labels. Our method reports a mean dice of 0.64 for task 3 and 0.85 for task 4 on the test sets, taking third place on the challenge. Our code and models are publicly available at https://github.com/TheoEst/abdominal_registration and https://github.com/TheoEst/hippocampus_registration
    corecore