5 research outputs found

    L'utilisation des outils bioinformatiques pour caractériser le paysage immunologique du cancer de la prostate

    Get PDF
    Dans le cadre de mon doctorat j'ai développé des approches appliquées d'analyse de données pour effectuer une analyse multi omique du cancer de la prostate (CaP). Mon projet s'est défini en deux parties distinctes correspondant aux deux articles intégrés dans le corps de mon document. Une première partie du travail a consisté à récupérer des données omiques de différents types (RNA-Seq, Methylation, CNA, SNA, miRNA, données cliniques) associées au CaP et à les préparer avec un pipeline bioinformatique adapté. Ensuite j'ai eu pour objectif de chercher à mettre en avant de nouveaux points de contrôles de l'immunité associés à la récidive biochimique (BCR) dans le CaP au travers de ces données. Pour remplir cet objectif j'ai utilisé une approche particulière basée sur des algorithmes d'analyse en composante principale (PCA) et de régression des moindres carrés (PLS). Cela a permis de faire ressortir une famille spécifique de points de contrôle de l'immunité, la famille des LILR, qui peut potentiellement être une famille cible en immunothérapie. Dans un second temps, j'ai utilisé ces mêmes données pour développer un protocole d'analyse d'apprentissage machine (ML). Le but de ce travail était de montrer qu'il était possible de prédire si des patients allaient récidiver ou pas à partir de données RNA-Seq. J'ai montré que même avec des petits jeux de données on pouvait atteindre des scores de prédiction très bon et que les algorithmes actuels de ML prenaient bien en compte la variabilité technique de la diversité des sources de données dans le CaP. Il est donc possible d'utiliser les biobanques actuelles possédées par les structures de recherches à travers le monde pour créer des jeux de données plus importants.As part of my PhD, I developed applied data analysis approaches to perform a multi-omic analysis of prostate cancer (CaP). My project was split into two distinct parts corresponding to the two articles integrated into the body of my document. A first part of the work consisted in recovering omics data of different types (RNA-Seq, Methylation, CNA, SNA, miRNA, clinical data) associated with CaP and preparing them with an adapted bioinformatics pipeline. Then, my goal was to seek to highlight new immunity checkpoints associated with biochemical recurrence (BCR) in CaP through these data. To fulfill this objective, I used a special approach based on Principal Component Analysis (PCA) and Partial Least Squares Regression (PLS) algorithms. This has brought out a specific family of immunity checkpoints, the LILR family, which can potentially be a target family in immunotherapy. Second, I used the same data to develop a machine learning (ML) analysis protocol. The aim of this work was to show that it was possible to predict whether or not patients would relapse from RNA-Seq data. I have shown that even with small datasets, one can achieve very good prediction scores and that current ML algorithms take into account the technical variability of the diverse data sources in the CaP. It is therefore possible to use current biobanks owned by research structures around the world to create larger datasets

    Marqueurs discursifs de neurodégénérescence liée à la pathologie Alzheimer

    Full text link
    La maladie d’Alzheimer (MA) et les aphasies progressives primaires (APP) s’accompagnent de perturbations du langage expressif parfois subtiles, mais précoces dans l’évolution de ces maladies neurodégénératives. Considérés dans une approche automatisée, ces changements pourraient constituer des marqueurs de dégénérescence identifiés de façon non invasive et peu onéreuse. À ce titre, ils font l’objet d’études visant à automatiser leur utilisation clinique. Cependant, l’intégration des marqueurs langagiers à une approche diagnostique centrée sur les biomarqueurs reste à faire. À cette fin, la présente thèse a deux objectifs. D’abord, recenser systématiquement les marqueurs du discours qui distinguent le mieux les personnes avec une MA de témoins en santé. Ensuite, appliquer une approche automatisée et à un large éventail de marqueurs de discours pour identifier, dans un groupe hétérogène de patients avec une APP, lesquels ont une pathologie Alzheimer sous-jacente. Afin de mettre en contexte ces deux objectifs, nous proposons une introduction générale comprenant les éléments suivants : la pathophysiologie de la MA et des APP, le rôle croissant des biomarqueurs dans la prise de décision clinique dans les maladies neurodégénératives, les études pionnières du discours en neurodégénérescence, ainsi que de récentes études computationnelles sur les marqueurs de discours dans la MA et les APP. Nos résultats font émerger un patron multidimensionnel (acoustique, lexical, syntaxique, sémantique et pragmatique) de changements langagiers qui distinguent les personnes avec une MA de témoins en santé, avec une prépondérance des marqueurs lexicosémantiques. Dans le groupe de patients avec une APP avec une imagerie amyloïde positive ou négative, nous mesurons ensuite le pouvoir de classification d’un court échantillon de discours et montrons qu’il peut être avantageusement comparé à d’autres biomarqueurs. Nous discutons du patron spécifique de marqueurs discriminants pour ce sous-groupe de patients, notamment l’importance des marqueurs psycholinguistiques pour prédire le résultat de l’imagerie amyloïde à partir du discours.Alzheimer’s disease (AD) and primary progressive aphasias (PPA) feature changes in expressive language that appear early in the course of the disease. Within an automated analysis framework, these language changes could offer a non-invasive and inexpensive alternative to the collection of biomarkers which are not readily available in most settings. Current research is thus focused on the automated analysis of language data for clinical use. The usefulness of connected speech (CS) markers has not yet been established in a diagnostic perspective focused on biomarkers. To this aim, the present thesis contains two phases. First, we systematically review the CS markers that best differentiate persons with AD from healthy controls. Second, we automatically extract a wide array of CS markers in a heterogenous group of PPA patients by combining expert knowledge and the latest natural language processing software. A machine-learning classification approach identifies PPA patients for the presence of underlying AD pathology. The most discriminant CS features are identified. To integrate the two phases of the thesis, we provide a general introduction with the following sections: the pathophysiology of AD and PPAs, the growing importance of biomarkers in clinical decision-making for neurodegenerative diseases, the seminal studies of CS in neurodegenerative diseases, and the latest computational studies of CS markers in AD and PPA. Our results bring forth a multidimensional pattern (acoustic, lexical, syntactic, semantic, pragmatic) of language changes that distinguish people with AD from healthy controls, with an emphasis on lexical-semantic features. In the group of PPA patients with either positive or negative amyloid imaging, we then describe the classificatory power of a short sample of CS and show that it compares favorably to other biomarkers. We discuss the specific pattern of discriminant markers for this subgroup of patients, in particular the role of psycholinguistics

    Le cœur métabolique : la métabolomique afin de mieux caractériser l’infarctus du myocarde

    Full text link
    Dans les syndromes coronariens aigus, le ticagrelor améliore la survie comparativement au clopidogrel. Les effets pléiotropiques de ce médicament ne sont pas entièrement compris. La métabolomique non ciblée, couplée avec des analyses computationnelles, a le potentiel d’élucider les changements pathophysiologiques du métabolisme cellulaire associés aux différentes maladies et aux traitements. L’objectif de cette étude est de dévoiler une signature métabolomique discriminante entre le clopidogrel et le ticagrelor dans le traitement de l’infarctus du myocarde avec élévation du segment ST (STEMI). La population de l’étude est formée de 175 participants de l’essai PLATO avec STEMI ayant subi une intervention percutanée (PCI), randomisés à recevoir le clopidogrel (n=88) ou le ticagrelor (n=87), appariés pour l’âge, le sexe, le statut de dyslipidémie et de diabète. Un profil métabolomique plasmatique non ciblé, obtenu par spectrométrie de masse (MS), est effectué pour chaque individu à l’état de base (BL; maladie aiguë) et au congé de l’hôpital après en moyenne 4 jours d’hospitalisation (DC; état post-traitement). L’étude des données a été effectuée par une analyse de quantification différentielle, une analyse de la variance, la construction d'un réseau de co-modulation et des techniques d'apprentissage automatique. Huit (8) métabolites étaient modulés de façon différentielle entre les deux groupes de traitement au congé, dont six (6) appartenant aux voies de biosynthèse des acides gras polyinsaturés omega-3 (n3) et omega-6 (n6). Les participants traités avec ticagrelor présentent des niveaux plasmatiques significativement plus élevés des acides gras suivants : α et de γ-linolénate (n3 and n6), dihomo-linolénate (n6), stéaridonate (n3), docosahexaenoate (DHA; n3), eicosapentaenoate (EPA; n3) et arachidonate (AA; n6). Chez les patients avec STEMI traités par PCI, des analyses de métabolomique non ciblées révèlent que les métabolites impliqués dans la biosynthèse des omega-3 et des omega-6 sont significativement plus élevé au congé dans le groupe traité par le ticagrelor, comparativement au clopidogrel, suggérant que le remodelage du réseau métabolique après un infarctus du myocarde pourrait interagir avec la réponse aux antiplaquettaires.Background: In acute coronary syndromes, ticagrelor improved survival compared to clopidogrel. Pleiotropic effects of this drug are not entirely elucidated. Untargeted metabolomics coupled with computational analyses has the potential to help understanding pathophysiological changes of cellular metabolism associated with different disease states and therapies. Objectives: The purpose of this study is to unveil a discriminant metabolomics signature comparing ST-elevation myocardial infarction (STEMI) patients treated with clopidogrel and ticagrelor. Methods: The study population consists of 175 participants with STEMI from the PLATO Trial who underwent percutaneous coronary intervention (PCI), randomized to receive clopidogrel (n=88) or ticagrelor (n=87), matched for age, sex, dyslipidemia and diabetes status. Untargeted mass spectrometry (MS)-based metabolomics profiling in plasma was performed at baseline (BL; acute disease state) and repeated at hospital discharge after an average of 4 days of hospitalization (DC; post-treatment state), for each individual. Data analysis was done through differential quantification analysis, analysis of variance, co-modulation network construction and machine learning techniques. Results: Eight (8) metabolites were differentially modulated by treatment between groups at DC, six (6) of which belong to the polyunsaturated fatty acids omega-3 (n3) and omega-6 (n6) biosynthesis pathways. Participants treated with ticagrelor harbor a significantly higher plasmatic level of α and γ linolenate (n3 and n6), dihomo-linolenate (n6), stearidonate (n3), docosahexaenoate (DHA; n3), eicosapentaenoate (EPA; n3) and arachidonate (AA; n6). Conclusion: In patients with STEMI undergoing PCI, untargeted metabolomics reveals that metabolites involved in omega-3 and omega-6 biosynthesis are significantly higher at discharge in the ticagrelor treatment group when compared to clopidogrel, suggesting that the remodeling of the metabolic network after myocardial infarction may interact with the response to antiplatelet drugs

    Analyse multiomique pour l’identification de biomarqueurs prédictifs de la réponse aux vaccins

    Full text link
    Cette thèse traite de l’utilisation de données large échelle pour élucider les mécanismes de réponse à un vaccin et identifier des biomarqueurs permettant de prédire une réponse immunitaire protectrice induite par la vaccination. La vaccination s'est avérée très efficace pour prévenir et éradiquer certaines maladies infectieuses. Malgré cela, certaines personnes ne bénéficient pas de la vaccination. De plus, pour certains pathogènes, comme le VIH, le développement d'un vaccin efficace s’avère difficile. Les technologies large échelle fournissent un moyen d'évaluer le système immunitaire dans son intégralité et permettent d'évaluer l'impact de l'hôte et des facteurs environnementaux qui façonnent la réponse vaccinale. Dans cette thèse, nous montrons comment l’analyse bioinformatique de données large échelle a permis d’identifier des gènes et protéines inflammatoires comme marqueurs d’une faible réponse au vaccin contre l’HepB et contre le VIH, ainsi que comme marqueurs associés avec la sévérité des symptômes d’une infection virale respiratoire. De plus, nous démontrons comment l’utilisation de méthodes d’intégration d'ensembles de données provenant de multiples plates-formes multiomiques permet l’identification de mécanismes impliqués dans la modulation de la réponse vaccinale. En effet, une analyse intégrative a révélé le lien entre les cellules sanguines, l’hème et la réponse inflammatoire associée avec une réponse au vaccin contre l’HepB. Une analyse intégrative a également mené à l’identification des cellules dendritiques comme source des interférons et les lymphocytes CD4+ comme cible des interférons; les deux impliqués dans le mécanisme de réponse au vaccin RV144. Ainsi, l’utilisation des données large échelle combinée aux analyses bio-informatiques apportent de nouvelles solutions aux défis actuels de la vaccination.Vaccination has proven highly effective in preventing and eradicating infectious diseases. A significant number of subjects, however, respond poorly to vaccination. In addition, for some pathogens, including HIV, the development of an efficient vaccine has been challenging. Systems vaccinology provides a means to assess the immune system comprehensively and allows one to evaluate the impact of host and environmental factors shaping the vaccine response. This unbiased approach allowed us to identify inflammatory genes (ex. C3AR1, CXCL2, HEBP1) and proteins (ex. TNF�, TNFR2) as putative markers of the hyporesponse to vaccines (against Hepatitis B and HIV) and severe symptoms following infection with respiratory viruses (Influenza, RSV, Rhinovirus). These biomarkers were measured pre-vaccination (respiratory viruses and Hepatitis B vaccine) or early after vaccination (HIV vaccine). In addition to identifying new biomarkers that can predict a. protective immune response to foreign pathogens, the integrative analysis of those system-wide data allowed a better understanding of the mechanisms triggered by vaccine-induced perturbations of the immune system. As illustrated for the RV144 vaccine against HIV, the integrative analysis allowed us to identify dendritic cells as the source and CD4+ T cells as the target cells of an antiviral program that confers the protection triggered by the vaccine. Systems vaccinology and the integration of datasets from multiple OMICs platforms represent a quantum step towards understanding immunity and vaccine responses; these approaches will provide novel solutions to the current vaccination challenges

    Systèmes d’intelligence artificielle et santé : les enjeux d’une innovation responsable.

    Full text link
    L’avènement de l’utilisation de systèmes d’intelligence artificielle (IA) en santé s’inscrit dans le cadre d’une nouvelle médecine « haute définition » qui se veut prédictive, préventive et personnalisée en tirant partie d’une quantité inédite de données aujourd’hui disponibles. Au cœur de l’innovation numérique en santé, le développement de systèmes d’IA est à la base d’un système de santé interconnecté et auto-apprenant qui permettrait, entre autres, de redéfinir la classification des maladies, de générer de nouvelles connaissances médicales, ou de prédire les trajectoires de santé des individus en vue d’une meilleure prévention. Différentes applications en santé de la recherche en IA sont envisagées, allant de l’aide à la décision médicale par des systèmes experts à la médecine de précision (ex. ciblage pharmacologique), en passant par la prévention individualisée grâce à des trajectoires de santé élaborées sur la base de marqueurs biologiques. Des préoccupations éthiques pressantes relatives à l’impact de l’IA sur nos sociétés émergent avec le recours grandissant aux algorithmes pour analyser un nombre croissant de données relatives à la santé (souvent personnelles, sinon sensibles) ainsi que la réduction de la supervision humaine de nombreux processus automatisés. Les limites de l’analyse des données massives, la nécessité de partage et l’opacité des décisions algorithmiques sont à la source de différentes préoccupations éthiques relatives à la protection de la vie privée et de l’intimité, au consentement libre et éclairé, à la justice sociale, à la déshumanisation des soins et du patient, ou encore à la sécurité. Pour répondre à ces enjeux, de nombreuses initiatives se sont penchées sur la définition et l’application de principes directeurs en vue d’une gouvernance éthique de l’IA. L’opérationnalisation de ces principes s’accompagne cependant de différentes difficultés de l’éthique appliquée, tant relatives à la portée (universelle ou plurielle) desdits principes qu’à la façon de les mettre en pratique (des méthodes inductives ou déductives). S’il semble que ces difficultés trouvent des réponses dans la démarche éthique (soit une approche sensible aux contextes d’application), cette manière de faire se heurte à différents défis. L’analyse des craintes et des attentes citoyennes qui émanent des discussions ayant eu lieu lors de la coconstruction de la Déclaration de Montréal relativement au développement responsable de l’IA permet d’en dessiner les contours. Cette analyse a permis de mettre en évidence trois principaux défis relatifs à l’exercice de la responsabilité qui pourrait nuire à la mise en place d’une gouvernance éthique de l’IA en santé : l’incapacitation des professionnels de santé et des patients, le problème des mains multiples et l’agentivité artificielle. Ces défis demandent de se pencher sur la création de systèmes d’IA capacitants et de préserver l’agentivité humaine afin de favoriser le développement d’une responsabilité (pragmatique) partagée entre les différentes parties prenantes du développement des systèmes d’IA en santé. Répondre à ces différents défis est essentiel afin d’adapter les mécanismes de gouvernance existants et de permettre le développement d’une innovation numérique en santé responsable, qui doit garder l’humain au centre de ses développements.The use of artificial intelligence (AI) systems in health is part of the advent of a new "high definition" medicine that is predictive, preventive and personalized, benefiting from the unprecedented amount of data that is today available. At the heart of digital health innovation, the development of AI systems promises to lead to an interconnected and self-learning healthcare system. AI systems could thus help to redefine the classification of diseases, generate new medical knowledge, or predict the health trajectories of individuals for prevention purposes. Today, various applications in healthcare are being considered, ranging from assistance to medical decision-making through expert systems to precision medicine (e.g. pharmacological targeting), as well as individualized prevention through health trajectories developed on the basis of biological markers. However, urgent ethical concerns emerge with the increasing use of algorithms to analyze a growing number of data related to health (often personal and sensitive) as well as the reduction of human intervention in many automated processes. From the limitations of big data analysis, the need for data sharing and the algorithmic decision ‘opacity’ stems various ethical concerns relating to the protection of privacy and intimacy, free and informed consent, social justice, dehumanization of care and patients, and/or security. To address these challenges, many initiatives have focused on defining and applying principles for an ethical governance of AI. However, the operationalization of these principles faces various difficulties inherent to applied ethics, which originate either from the scope (universal or plural) of these principles or the way these principles are put into practice (inductive or deductive methods). These issues can be addressed with context-specific or bottom-up approaches of applied ethics. However, people who embrace these approaches still face several challenges. From an analysis of citizens' fears and expectations emerging from the discussions that took place during the coconstruction of the Montreal Declaration for a Responsible Development of AI, it is possible to get a sense of what these difficulties look like. From this analysis, three main challenges emerge: the incapacitation of health professionals and patients, the many hands problem, and artificial agency. These challenges call for AI systems that empower people and that allow to maintain human agency, in order to foster the development of (pragmatic) shared responsibility among the various stakeholders involved in the development of healthcare AI systems. Meeting these challenges is essential in order to adapt existing governance mechanisms and enable the development of a responsible digital innovation in healthcare and research that allows human beings to remain at the center of its development
    corecore