2 research outputs found

    Effect of the surrounding nucleotide context on the prediction, the folding and the function of RNA G-quadruplex structures

    Get PDF
    L’ARN est une biomolécule essentielle dont la fonction est étroitement reliée à sa structure secondaire. Les G-quadruplexes (G4) formés de l’empilement de tétrades de G, qui sont des agencements coplanaires de guanines stabilisées par des paires de bases Hoogsteen et la présence de cations potassium, sont des structures secondaires très stables. Les G4 sont adoptés par les séquences respectant le motif canonique suivant : (G3‑N1-7)3G3. Les G4 d’ARN (rG4) présents dans les ARN messagers (ARNm) sont connus pour réguler de nombreux processus post-transcriptionnels tels que l’épissage et la traduction. Cependant, plusieurs séquences respectant le motif canonique rG4 ne forment pas la structure lorsqu’elles sont testées expérimentalement. À l’inverse, plusieurs séquences qui divergent du motif ont été démontrées pour adopter la structure rG4. Cela suggère que d’autres facteurs influencent le repliement. La présence de cytosines dans le contexte nucléotidique rapproché du motif rG4, qui pourraient former des paires de bases G‑C avec les séries de G, a été proposée comme un facteur compétitif à la formation de rG4. Afin de confirmer cette hypothèse, une technique in vitro permettant d’analyser le repliement rG4 de plus longues séquences était nécessaire. La cartographie in-line a été adaptée puis appliquée sur des séquences rG4 potentielles avec un large contexte nucléotidique. Cela a permis de confirmer l’influence des séries de G et des séries de C dans l’environnement immédiat sur le repliement du rG4. Un nouveau score prédictif tenant compte de ces séries a été établi permettant d’améliorer la sensibilité et la spécificité des prédictions de repliement rG4. Les outils d’expérimentation et de prédiction développés dans le cadre des travaux ayant mené à cette thèse ont permis de prédire et d’évaluer le repliement de plusieurs candidats rG4 de motifs variés présents dans les 5’UTR d’ARNm. De plus, la présence enrichie de rG4 dans des ARNm associés au cancer colorectal a pu être détectée. Le rG4 irrégulier identifié dans le transcrit BAG-1 et son contexte nucléotidique complet en 5’UTR ont été étudiés en détail afin de mesurer l’effet du rG4 sur la structure secondaire globale. Les effets du rG4 sur la traduction ainsi que son interaction fonctionnelle avec de nombreux éléments régulateurs de la traduction situés en cis, tels des codons de départ alternatifs, un uORF et une structure IRES ont été mesurés. La considération du contexte nucléotidique est essentielle afin de correctement prédire et de permettre le repliement rG4, ainsi que pour déterminer ses fonctions biologiques.RNA is an essential biomolecule whose function is highly related to its secondary structure. The G-quadruplexes (G4s) formed by the stacking of G-quartets, which are co-planar arrangements of guanines stabilised by Hoogsteen base-pairs and potassium cations, are highly stable secondary structures. G4s are adopted by sequences corresponding to the consensus motif: (G3‑N1-7)3G3. RNA G4s (rG4s) located in messenger ARNs (mRNAs) are known to regulate numerous post-transcriptonal processes such as splicing and translation. However, many sequences presenting the consensus rG4 motif do not fold into the structure when they are experimentally validated. In contrast, many sequences differing from the motif were demonstrated to adopt the rG4 structure. This suggest that other factors influence the folding. It was proposed that the presence of many cytosines in the proximal nucleotide context of the rG4 motif was a competing factor to rG4 folding by forming G-C base-pairs with the G-tracts. To confirm this hypothesis, an in vitro technique allowing to probe the rG4 folding of longer sequences was necessary. The in-line probing technique was adapted and applied to potential rG4 sequences candidates with their large nucleotide context. These in-line probing results confirmed the influence of the G- and C-tracts of the surrounding environment on the rG4 folding. A new predictive score calculating those tracts was established which improved the sensibility and the specificity of the rG4 folding predictions. The experimentation and scoring tools developed as part of the work leading up to this thesis allowed to predict and to probe the secondary structures of many rG4 candidates with various motifs located in the 5’UTR of mRNAs. Furthermore, the enrichment of rG4 in mRNAs associated to colorectal cancer was detected. The irregular rG4 identified in the BAG-1 transcript and its complete 5’UTR nucleotide context were studied in detail in order to measure the rG4 effect on the global secondary structure. The rG4 effects on translation as well as its functional interaction with several cis translational regulatory elements such as alternative start codons, an uORF and an IRES structure was measured. The analysis of the nucleotide context is essential to predict accurately if it allows rG4 folding, as well as to decipher the biological functions of the structure
    corecore