Développement de méthodes computationnelles pour la transcriptomique spatiale basée sur l'image

Abstract

Spatial transcriptomics methods provide crucial insights into the cellular heterogeneity and spatial organization of complex multicellular systems. Combining molecular and spatial information helps elucidate tissue architecture during development and disease. Although several commercial approaches are available, they are expensive and offer limited flexibility. In contrast, homebuilt methods provide cost-effective and customizable alternatives. Still, Both commercial and homebuilt pose analytical challenges. One the crucial analysis step is to identify RNA expression profiles at the single-cell level. Therefore, precise cell segmentation is critical, as accurate RNA profiles depend on correctly segmented cells.In the first part of this thesis, I present as a step-by-step guide to implement and perform homebuilt spatial transcriptomics. This guide spans the entire life cycle of a project,from its initial definition to experimental choices, wet lab approaches, instrumentation,and analysis. Beyond a litteratrue ressource, I present two of my contribution. First a data analysis pipeline for our recently submitted manuscript, where we present autoFISH, a complete toolbox to perform automated single molecule FISH (smFISH). Second I present a simulation environment to guide the choice of marker genes by anticipating analysis challenges.In a second part I describe my work on cell segmentation in image-based spatialtranscriptomics (IST). I present two novel segmentation methods, each tailored fora different experimental set-up. First, I developed Comseg, apoint-cloud segmentation method based on a graph of RNA nodes weighted by co-expression. ComSeg can be used on IST data missing cell staining. Secondly, we developed RNAseg, a cell staining-based method taking advantage of RNA position to identify cell on various cell staining quality.Les méthodes de transcriptomique spatiale offrent des informations essentielles sur l'hétérogénéité cellulaire et l'organisation spatiale des systèmes multicellulaires complexes. La combinaison d'informations moléculaires et spatiales aide à étudier l'architecture des tissus pendant le développement et les maladies. Bien que plusieurs approches commerciales soient disponibles, elles sont coûteuses et offrent une flexibilité limitée. En revanche, les méthodes développées en laboratoire "open source" offrent des alternatives économiques et personnalisables. Cependant, tant les approches commerciales que celles "open source" développées en laboratoire posent des défis analytiques. L'une des étapes d'analyse cruciales consiste à identifier les profils d'expression de l'ARN au niveau de la cellule unique. Par conséquent, une segmentation cellulaire précise est essentielle, car des profils d'ARN fiables dépendent de cellules correctement segmentées.Dans la première partie de cette thèse, je propose un guide étape par étape pour mettre en œuvre et réaliser une transcriptomique spatiale développée en laboratoire. Ce guide couvre l'ensemble du cycle de vie d'un projet, depuis sa définition initiale jusqu'aux choix expérimentaux,, à l'instrumentation et à l'analyse. Au-delà d'une ressource bibliographique, je présente deux de mes contributions. Tout d'abord, un pipeline d'analyse de données pour notre manuscrit récemment soumis, où nous présentons autoFISH, une boîte à outils complète pour effectuer des expériences automatisées de FISH à molécule unique (smFISH). Ensuite, je présente un environnement de simulation conçu pour guider le choix des gènes marqueurs en anticipant les défis analytiques.Dans une deuxième partie, je décris mon travail sur la segmentation cellulaire pour transcriptomique spatiale basée sur l'image (IST). Je présente deux nouvelles méthodes de segmentation, chacune adaptée à un type IST. Premièrement, j'ai développé ComSeg, une méthode de segmentation basée sur un nuage de points et utilisant un graphe de nœuds d'ARN pondérés par co-expression. ComSeg peut être utilisé sur des données IST ne comportant pas de coloration cellulaire. Deuxièmement, nous avons développé RNAseg, une méthode basée sur la coloration cellulaire qui exploite la position de l'ARN pour identifier les cellules dans des données où la coloration cellulaire est de qualité variable

Similar works

Full text

thumbnail-image

thèses en ligne de ParisTech

redirect
Last time updated on 08/11/2025

This paper was published in thèses en ligne de ParisTech.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.

Licence: info:eu-repo/semantics/OpenAccess