5 research outputs found

    Εντοπισμός RNA τροποποιήσεων σε δεδομένα μεταγραφώματος και εκτίμηση της επίδρασής τους στους στόχους των miRNA

    Get PDF
    Η μεταγραφική τροποποίηση είναι μια μεταγραφική/μετα-μεταγραφική διαδικασία, κατά την οποία ένα μόριο RNA υπόκειται στη μεταλλαγή της ακολουθίας του μέσω της εισαγωγής, της απαλοιφής ή της μεταβολής των βάσεων της. Στα μετάζωα, η πλειονότητα των μεταγραφικών τροποποιήσεων που συμβαίνουν αφορά τη μετατροπή του νουκλεοτιδίου αδενοσίνη (Α) σε ινοσίνη (I), φαινόμενο που καταλύεται από τα μέλη της οικογένειας των γονιδίων των απαμινάσεων της αδενοσίνης (ADAR) που δρουν σε RNA με διπλή έλικα (dsRNA). Το φαινόμενο της μεταγραφικής τροποποίησης εμφανίζει σχετικά αυξημένη συχνότητα σε μόρια που φέρουν περιοχές ρετροτρανσποζονίων Alu στην ακολουθία τους. Η τροποποίηση της κωδικής περιοχής των pre-mRNA μπορεί να οδηγήσει στην ενσωμάτωση διαφορετικού αμινοξέος κατά τη μετάφραση και να συμβάλει έτσι στην ποικιλότητα των πρωτεϊνικών προϊόντων και λειτουργιών. Ωστόσο, οι περισσότερες Aσε-I τροποποιήσεις απαντώνται σε μη κωδικές περιοχές των pre-mRNA και των mRNA, καθώς και σε μη κωδικά RNA. Οι μετατροπές στην UTR (μη μεταφραζόμενη περιοχή) ενός mRNA μπορούν να ρυθμίσουν τη μετάφραση, το μάτισμα και την αποικοδόμησή τους. Επίσης, τροποποιήσεις σε ακολουθίες microRNA (miRNA) και long non-coding RNA (lncRNA), καθώς και τροποποιήσεις στις θέσεις πρόσδεσής τους, μπορούν να επηρεάσουν τη βιογένεσή τους, την αναγνώριση των στόχων τους, τη δομή και τη σταθερότητά τους. Στόχος αυτής της μελέτης είναι να γίνει σύγκριση μιας ομάδας εργαλείων για τον εντοπισμό RNA τροποποιήσεων, να διαχωριστούν τα πραγματικά συμβάντα μεταλλαγής στις 3’UTR των mRNA και να εκτιμηθεί η επίδρασή τους στην ειδικότητα και στην αποτελεσματικότητα της πρόσδεσής των miRNA. Αρχικά, χρησιμοποιήθηκαν ζευγάρια από σύνολα δεδομένων αλληλούχισης του RNA και του DNA του ίδιου δείγματος ώστε να εντοπιστούν A-σε-I RNA τροποποιήσεις σε 3’UTR περιοχές. Η χρήση ζευγών έγινε με σκοπό να εξεταστούν συμβάντα σε επίπεδο δείγματος, αυξάνοντας έτσι την ειδικότητα. Το σύνολο των δεδομένων που χρησιμοποιήθηκε αποτελούνταν από 2 δείγματα για δοκιμή, 1 ADAR enzyme knockdown δείγμα για έλεγχο και τη RADAR, μία περιεκτική συλλογή A-σε-I δεδομένων στα μεταγραφώματα του ανθρώπου, του ποντικιού και της μύγας, με τους δύο προαναφερθέντες πόρους να αποτελούν τα δεδομένα αντικειμενικής αλήθειας για τη μελέτη. Στη συνέχεια, αναζητήθηκε ο καλύτερος αλγόριθμος στον εντοπισμό RNA τροποποιήσεων. Το ADAR knockdown δείγμα χρησιμοποιήθηκε ώστε να επισημανθούν τα υψηλά ψευδώς θετικά ποσοστά. Η σύγκριση περιλάμβανε το RES-Scanner, που χρησιμοποιεί τον Burrows-Wheeler aligner (BWA), το REDItools που τρέχει με τον aligner GSNAP και το RNAEditor, το οποίο εκτελέστηκε τόσο με τον BWA (προκαθορισμένη επιλογή) όσο και με τον GSNAP. Οι δύο πρώτοι αλγόριθμοι υποστηρίζουν εκ κατασκευής ζευγάρια RNA-DNA συνόλων δεδομένων, ενώ ο τρίτος τροποποιήθηκε ώστε να λαμβάνει υπόψιν και την DNA πληροφορία. Πιο σταθερή συμπεριφορά σε σχέση με την ειδικότητα και την ευαισθησία στα αποτελέσματα αναδείχθηκε να έχει το RNAEditor αξιοποιώντας τον aligner ΒWA. Μετέπειτα, 3’UTR που βρέθηκαν να φέρουν τροποποίηση δόθηκαν ως είσοδος στους αλγορίθμους πρόβλεψης στόχων των miRNA ώστε να εκτιμηθούν στατιστικά διαφορές στις υπολογισμένες περιοχές πρόσδεσης που δημιουργήθηκαν εξαιτίας των φαινομένων τροποποίησης. Σε αυτό το στάδιο η σύγκριση επεκτάθηκε προσθέτοντας ένα ακόμα δείγμα με φυσιολογική (wild-type) έκφραση του ADAR από το ίδιο πείραμα με το ADAR knockdown δείγμα. Συμβάντα τα οποία καταγράφηκαν σε 3’UTR χρησιμοποιήθηκαν ώστε να παραχθούν 2 ισάριθμα σύνολα από ακολουθίες, από τις οποίες 2062 ανήκαν σε περιοχές με υψηλό αριθμό διαδοχικών επαναλήψεων Alu και 144 σε non-Alu. Επίσης, χρησιμοποιήθηκαν τα πρώτα 50 σε έκφραση miRNA για κάθε δείγμα, ώστε να περιοριστεί το εύρος των περιοχών πρόβλεψης στόχων miRNA στην ανάλυση που έγινε με τους αλγορίθμους TargetScan και MIRZA-G. Και οι 2 εκτελέστηκαν χωρίς να λαμβάνονται υπόψιν εξελικτικά χαρακτηριστικά, καθότι αυτά δεν είναι δυνατόν να υπολογιστούν για τις περιοχές που υφίστανται τροποποίηση. Τα αποτελέσματα υποδηλώνουν ότι οι τροποποιήσεις κυρίως μεταβάλλουν τα χαρακτηριστικά των υφιστάμενων περιοχών πρόσδεσης, ενώ σε πολύ μικρότερο βαθμό τις καθιστούν εντελώς μη λειτουργικές ή δημιουργούν νέες περιοχές. Επιπροσθέτως, παρατηρήθηκε ήπια μεταβολή της κατασταλτικής δράσης των miRNA που στοχεύουν τροποποιημένες UTR. Ξεχωριστή ανάλυση των UTR που εμφανίζουν υψηλό αριθμό τροποποιήσεων δεν υπέδειξε σημαντική συσχέτιση με το βαθμό αυξομείωσης της καταστολής. Το γεγονός ότι η κατασταλτική δράση των miRNA δε φάνηκε να επηρεάζεται καθολικά προς μία κατεύθυνση, υποδηλώνει πως ο ρυθμιστικός ρόλος των RNA τροποποιήσεων δεν ακολουθεί ένα γενικό κανόνα, αντιθέτως, δρα ως μηχανισμός βελτιστοποίησης, κατά περίπτωση ισχυροποιώντας ή αποδυναμώνοντας την πρόσδεση. Σε αυτή τη μελέτη συγκρίναμε εργαλεία για τον εντοπισμό RNA τροποποιήσεων, καταλήξαμε με ένα σύνολο τροποποιημένων 3’UTR και πραγματοποιήσαμε ανάλυση για την πρόβλεψη στόχων των miRNA σε αυτές, η οποία υπέδειξε άλλοτε ενίσχυση και άλλοτε εξασθένηση της κατασταλτικής δράσης των miRNA στους στόχους τους, με ένταση ανεξάρτητη του αριθμού των συμβάντων τροποποίησης στην περιοχή πρόσδεσης. Περαιτέρω αναλύσεις με περισσότερα δείγματα και καταστάσεις θα φανούν χρήσιμες ώστε να επιβεβαιωθούν και να καταστούν στατιστικά σημαντικότερα τα ευρήματα της παρούσας εργασίας.RNA editing is a co/post-transcriptional process, during which an RNA molecule is undergone an alteration of its sequence by insertion, deletion or modification. The majority of such changes in metazoans is comprised by adenosine (A) to inosine (I) nucleotide transitions, which are catalyzed by members of the adenosine deaminase gene family (ADAR) acting on double-stranded RNA (dsRNA). RNA editing is relatively widespread in Alu-containing mRNA molecules. Editing of the coding sequence in pre-mRNAs can modify codons and lead to the incorporation of different amino acids during translation, contributing to protein function diversity. However, most A-to-I editing events occur in non-coding regions of pre-mRNAs and mRNAs, as well as in non-coding RNAs. Editing in the UTR (untranslated region) of mRNAs can regulate their translation, splicing and degradation. Also, events in microRNA (miRNA) and long non-coding RNA (lncRNA) sequences, as well as their binding sites, can affect their biogenesis, target recognition, structure and stability. The goal of this study was to compare a set of RNA editing identification tools, distinguish true substitution events in 3’UTR of mRNAs and assess their impact on miRNA specificity and binding efficacy. Initially, we used matching RNA and DNA sequencing data to identify A-to-I RNA editing events in 3’UTR regions. This was done to investigate event calls in individual level, increasing specificity. Our dataset consisted of 2 test samples, 1 ADAR enzyme knockdown control sample and RADAR, a comprehensive collection of A-to-I editing events in human, mouse and fly transcripts, with the last two resources being used as ground truth. Then we went on to find the best algorithm to identify events. The ADAR knockdown dataset was useful to pinpoint high false positive rates. The comparison included RES-Scanner employing the Burrows-Wheeler Aligner (BWA), REDItools running with GSNAP aligner and RNAEditor which was run with BWA (default option) and GSNAP. The first two approaches natively support paired/matched RNA-DNA datasets, while the latter was modified to include DNA information. The most robust behaviour in terms of sensitivity and specificity was observed from RNAEditor with BWA aligner. Edited and non-edited 3’UTR were subsequently used as input in miRNA target prediction algorithms to statistically assess differences in the computed binding sites that arose due to the editing phenomena. The wildtype counterpart of the ADAR knockdown experiment was employed here to further enhance the comparison. Events annotated in 3’UTR were used to generate 2 equally numbered sets of sequences, 2062 of which belonged to highly repetitive Alu regions and 144 in non-Alu. The top 50 expressed miRNA in each sample were used to confine the target prediction analysis that was performed using TargetScan and MIRZA-G algorithms. Both of them were run without incorporating evolutionary features, which cannot be effectively measured in the case of the edited sequences. The results show a strong preference towards modification of binding site feature distributions, rather than generating new or depleting existing sites. Moreover, we observed a mild alteration of the repressive action of miRNA targeting edited UTR. A separate analysis of highly edited UTR, i.e. UTR subjected to multiple editing events, did not indicate any correlation with the degree of the change. The lack of a global trend in the alteration of miRNA repressive activity implies RNA editing can serve distinct roles in miRNA efficacy, fine-tuning their targeting action on a case-by-case basis. In this study, we did a benchmark of RNA editing identification tools, we came up with a set of edited UTRs and performed miRNA target prediction on them. This analysis indicated alteration of the targeting efficacy by miRNA, irrespective of the number of editing events in the region. Further analyses of more samples and conditions will be useful to validate and empower our findings

    DIANA-mAP: Analyzing miRNA from Raw NGS Data to Quantification

    No full text
    microRNAs (miRNAs) are small non-coding RNAs (~22 nts) that are considered central post-transcriptional regulators of gene expression and key components in many pathological conditions. Next-Generation Sequencing (NGS) technologies have led to inexpensive, massive data production, revolutionizing every research aspect in the fields of biology and medicine. Particularly, small RNA-Seq (sRNA-Seq) enables small non-coding RNA quantification on a high-throughput scale, providing a closer look into the expression profiles of these crucial regulators within the cell. Here, we present DIANA-microRNA-Analysis-Pipeline (DIANA-mAP), a fully automated computational pipeline that allows the user to perform miRNA NGS data analysis from raw sRNA-Seq libraries to quantification and Differential Expression Analysis in an easy, scalable, efficient, and intuitive way. Emphasis has been given to data pre-processing, an early, critical step in the analysis for the robustness of the final results and conclusions. Through modularity, parallelizability and customization, DIANA-mAP produces high quality expression results, reports and graphs for downstream data mining and statistical analysis. In an extended evaluation, the tool outperforms similar tools providing pre-processing without any adapter knowledge. Closing, DIANA-mAP is a freely available tool. It is available dockerized with no dependency installations or standalone, accompanied by an installation manual through Github

    PlasmiR: A Manual Collection of Circulating microRNAs of Prognostic and Diagnostic Value

    No full text
    Simple Summary Only recently have the important biomarker capacities of microRNAs (miRNAs) in blood samples during disease been revealed. miRNAs are abundantly detected in circulation, and are less prone to degradation than longer RNA. Details regarding potential discriminatory miRNAs against numerous pathologic conditions are dispersed across articles, while existing resources that catalogue miRNA abundance in blood samples are not tailored to biomarker research. This study presents the meticulous manual curation of more than 200 articles that specifically interrogate the biomarker potential of miRNAs in whole blood, serum, or plasma. This annotation effort resulted in the creation of plasmiR, a database that systematically provides experimental evidence for the diagnostic and prognostic potential of circulating miRNAs against human diseases. plasmiR features 1021 entries, accompanied by rich study-specific meta-information, and an intuitive interface that enables the formation of complex queries and visualizations. Only recently, microRNAs (miRNAs) were found to exist in traceable and distinctive amounts in the human circulatory system, bringing forth the intriguing possibility of using them as minimally invasive biomarkers. miRNAs are short non-coding RNAs that act as potent post-transcriptional regulators of gene expression. Extensive studies in cancer and other disease landscapes investigate the protective/pathogenic functions of dysregulated miRNAs, as well as their biomarker potential. A specialized resource amassing experimentally verified, circulating miRNA biomarkers does not exist. We queried the existing literature to identify articles assessing diagnostic/prognostic roles of miRNAs in blood, serum, or plasma samples. Articles were scrutinized in order to exclude instances lacking sufficient experimental documentation or employing no biomarker assessment methods. We incorporated information from more than 200 biomedical articles, annotating crucial meta-information including cohort sizes, inclusion-exclusion criteria, disease/healthy confirmation methods and quantification details. miRNAs and diseases were systematically characterized using reference resources. Our circulating miRNA biomarker collection is provided as an online database, plasmiR. It consists of 1021 entries regarding 251 miRNAs and 112 diseases. More than half of plasmiR’s entries refer to cancerous and neoplastic conditions, 183 of them (32%) describing prognostic associations. plasmiR facilitates smart queries, emphasizing visualization and exploratory modes for all researchers

    TarBase-v9.0 extends experimentally supported miRNA-gene interactions to cell-types and virally encoded miRNAs

    No full text
    TarBase is a reference database dedicated to produce, curate and deliver high quality experimentally-supported microRNA (miRNA) targets on protein-coding transcripts. In its latest version (v9.0, https://dianalab.e-ce.uth.gr/tarbasev9), it pushes the envelope by introducing virally-encoded miRNAs, interactions leading to target-directed miRNA degradation (TDMD) events and the largest collection of miRNA-gene interactions to date in a plethora of experimental settings, tissues and cell-types. It catalogues similar to 6 million entries, comprising similar to 2 million unique miRNA-gene pairs, supported by 37 experimental (high- and low-yield) protocols in 172 tissues and cell-types. Interactions are annotated with rich metadata including information on genes/transcripts, miRNAs, samples, experimental contexts and publications, while millions of miRNA-binding locations are also provided at cell-type resolution. A completely re-designed interface with state-of-the-art web technologies, incorporates more features, and allows flexible and ingenious use. The new interface provides the capability to design sophisticated queries with numerous filtering criteria including cell lines, experimental conditions, cell types, experimental methods, species and/or tissues of interest. Additionally, a plethora of fine-tuning capacities have been integrated to the platform, offering the refinement of the returned interactions based on miRNA confidence and expression levels, while boundless local retrieval of the offered interactions and metadata is enabled. Graphical Abstrac
    corecore