12 research outputs found

    Обработка длинных чтений транскриптомного секвенирования на облачной вычислительной платформе amazon web services

    Get PDF
    Studies of genomes and transcriptomes are performed using sequencers that read the sequence of nucleotide residues of genomic DNA, RNA, or complementary DNA (cDNA). The analysis consists of an experimental part (obtaining primary data) and bioinformatic processing of primary data. The bioinformatics part is performed with different sets of input parameters. The selection of the optimal values of the parameters, as a rule, requires significant computing power. The article describes a protocol for processing transcriptome data by virtual computers provided by the cloud platform Amazon Web Services (AWS) using the example of the recently emerging technology of long DNA and RNA sequences (Oxford Nanopore Technology). As a result, a virtual machine and instructions for its use have been developed, thus allowing a wide range of molecular biologists to independently process the results obtained using the "Oxford nanopore".Исследования геномов и транскриптомов проводят с помощью секвенаторов, позволяющих считывать последовательность нуклеотидных остатков геномной ДНК, РНК или комплементарной ДНК. Каждое секвенирование биополимеров состоит из экспериментальной части (получение первичных данных) и их обработки средствами биоинформатики с использованием различных наборов входных параметров и значительных вычислительных мощностей. В статье описан протокол обработки транскриптома человека с применением виртуальных вычислительных машин, предоставляемых облачной платформой Amazon Web Services (AWS). Свободно и комерчески доступные возможности AWS рассмотрены с учетом требований к вычислительным ресурсам недавно анонсированной технологии длинных прочтений последовательностей ДНК и РНК («Oxford Nanopore Technology», Великобритания). Как результат нами был развернута виртуальная вычислительная машина в рамках доступных на AWS систем облачных решений и разработана инструкция для работы с ней, позволяющая молекулярным биологам самостоятельно адаптировать представленные вычислительные возможности для обработки результатов, полученных с использованием нанопорового секвенатора

    Перспективы использования секвенаторов третьего поколения для количественного профилирования транскриптома

    Get PDF
    Transcriptome profiling is widely employed to analyze transcriptome dynamics when studying various biological processes at the cell and tissue levels. Unlike the second generation sequencers, which sequence relatively short fragments of nucleic acids, the third generation DNA/RNA sequencers developed by biotechnology companies “PacBio” and “Oxford Nanopore Technologies” allow one to sequence transcripts as single molecules and may be considered as potential molecular counters capable to measure the number of copies of each transcript with high throughput, sensitivity, and specificity. In the present review, the features of single molecule sequencing technologies offered by “PacBio” and “Oxford Nanopore Technologies” are considered alongside with their utility for transcriptome analysis, including the analysis of transcript isoforms. The prospects and limitations of the single molecule sequencing technology in application to quantitative transcriptome profiling are also discussed.Транскриптомное профилирование широко используется для анализа динамики транскриптома при исследовании различных биологических процессов на клеточном и тканевом уровне. В отличие от секвенаторов второго поколения, которые секвенируют относительно короткие фрагменты нуклеиновых кислот, ДНК/РНК секвенаторы третьего поколения, разработанные биотехнологическими компаниями “PacBio” и “Oxford Nanopore Technologies”, позволяют секвенировать транскрипты как единичные молекулы и могут рассматриваться как потенциальные молекулярные счётчики, способные измерять количество копий каждого транскрипта с высокой производительностью, чувствительностью и специфичностью. В данном обзоре рассмотрены особенности технологий одномолекулярного секвенирования, предлагаемых компаниями “PacBio” и “Oxford Nanopore Technologies”, и применение технологий одномолекулярного секвенирования для целей транскриптомного анализа, включая анализ изоформ транкриптов. Также обсуждаются перспективы и ограничения их использования для количественного профилирования транскриптома

    Использование праймеров с высокой степенью мечения в полимеразной цепной реакции

    No full text
    The fluorescently-labeled DNA is widely used in various bioanalytical applications. For a number of applications, a high level of labeling could be beneficial. One of the ways to produce DNA fragments bearing multiple fluorescent tags is to use polymerase chain reaction (PCR) with primers heavily labeled with fluorophores. Here we tested how primers with multiple fluorescein tags perform in PCR. It has been found that the positioning of fluorescein tags at or near the 3′-end upon primer multiple labeling can inhibit DNA amplification (up to a complete stop when tags are placed at the 3′- or adjacent nucleotide). The mechanism, by which the presence of fluorescein tags at or near the primer 3′-end affects the PCR performance, is rather ambiguous and can involve both a steric hindrance for polymerase binding from the fluorescein moiety, as well as destabilization of a primer-template duplex. Nonetheless, if multiple fluorescein tags are attached so that at least three nucleotides from the primer 3′-end are unmodified, the production of DNA fragments bearing multiple fluorescein molecules is possible even if both primers are heavily labeled, though on the expense of amplicon yield.Флуоресцентно-меченую ДНК широко используют в различных биоаналитических приложениях. В ряде случаев высокий уровень меченья ДНК является преимуществом. Одним из способов получения фрагментов ДНК, несущих множественные флуоресцентные метки, является использование полимеразной цепной реакции (ПЦР) с праймерами с высокой степенью мечения. В данной работе мы исследовали, как присутствие многочисленных молекул флуоресцеина, прикреплённых к праймеру, влияет на результат ПЦР. Было обнаружено, что расположение флуоресцеиновой метки на 3′-конце праймера или вблизи него может ингибировать амплификацию (вплоть до полной остановки, когда метка находится непосредственно на 3′-концевом или соседнем с ним нуклеотиде). Механизм, посредством которого присутствие флуоресцеиновых меток на 3’-конце праймера или вблизи него влияет на эффективность ПЦР, довольно неоднозначен и может включать как стерическое препятствование связыванию полимеразы прикреплённой молекулой флуоресцеина, так и дестабилизацию дуплекса праймер-матрица. Тем не менее, если множественные флуоресцеиновые метки прикреплены к нуклеотидам праймера таким образом, что по меньшей мере три нуклеотида с его 3′-конца остаются немодифицированными, то получение фрагментов ДНК с высоким уровнем мечения возможно с помощью ПЦР, хотя и с заметно меньшим выходом, чем при использовании немодифицированных праймеров

    Прямая детекция микроРНК mir-34a, -145 и -218 с помощью CRISPR/Cas13a-нуклеазы

    No full text
    Using CRISPR/Cas13a-nuclease we have demonstrated a feasibility of direct detection of three miRNAs, miR-34a, -145, and -218 (their molecular signature is suggested as a diagnostic and prognostic biomarker in cervical cancer),. The detection is based on registration of a cleavage of molecular reporters bearing a fluorophore and a quencher by the complex of CRISPR/Cas13a-nuclease and guide RNA (gRNA) with a spacer of 21-23 nucleotides long. The detection sensitivity varied among miRNAs tested by 10-fold, presumably due to the unwanted intramolecular partial base paring of gRNA. The miRNA detection with Cas13a nuclease strongly depended on the presence of background RNA thus potentially compromising its direct application to complex media in a general case. Further optimization of measurement conditions including probably an additional amplification of the signal generated by collateral activity of Cas13a nuclease is necessary to directly detect miR-34a, -145, and -218 in biological samples.Показана возможность прямой детекции трех микроРНК, miR-34a, -145 и -218 (чья молекулярная сигнатура предлагается как диагностический и прогностический биомаркер при раке шейки матки), с помощью CRISPR/Cas13a-нуклеазы. Детекция основано на регистрации расщепления молекулярных «репортеров» – коротких РНК-олигонуклеотидов, несущих флуорофор и гаситель – комплексом CRISPR/Cas13a-нуклеазы и направляющей РНК (нРНК) со спейсером длиной 21-23 нуклеотида. Чувствительность обнаружения варьировала 10-кратно среди тестированных микроРНК, предположительно из-за нежелательного внутримолекулярного частичного спаривания оснований нРНК. Обнаружено, что детекция микроРНК с помощью нуклеазы Cas13a сильно зависит от присутствия фоновой РНК, что в общем случае может затруднить такую детекцию в сложном матриксе. Дальнейшая оптимизация условий измерения, включая, вероятно, дополнительное усиление сигнала, генерируемого коллатеральной активностью нуклеазы Cas13a, необходима для прямой детекции miR-34a, -145 и -218 в биологических образцах

    Перспективы использования секвенаторов третьего поколения для количественного профилирования транскриптома

    No full text
    Transcriptome profiling is widely employed to analyze transcriptome dynamics when studying various biological processes at the cell and tissue levels. Unlike the second generation sequencers, which sequence relatively short fragments of nucleic acids, the third generation DNA/RNA sequencers developed by biotechnology companies “PacBio” and “Oxford Nanopore Technologies” allow one to sequence transcripts as single molecules and may be considered as potential molecular counters capable to measure the number of copies of each transcript with high throughput, sensitivity, and specificity. In the present review, the features of single molecule sequencing technologies offered by “PacBio” and “Oxford Nanopore Technologies” are considered alongside with their utility for transcriptome analysis, including the analysis of transcript isoforms. The prospects and limitations of the single molecule sequencing technology in application to quantitative transcriptome profiling are also discussed.Транскриптомное профилирование широко используется для анализа динамики транскриптома при исследовании различных биологических процессов на клеточном и тканевом уровне. В отличие от секвенаторов второго поколения, которые секвенируют относительно короткие фрагменты нуклеиновых кислот, ДНК/РНК секвенаторы третьего поколения, разработанные биотехнологическими компаниями “PacBio” и “Oxford Nanopore Technologies”, позволяют секвенировать транскрипты как единичные молекулы и могут рассматриваться как потенциальные молекулярные счётчики, способные измерять количество копий каждого транскрипта с высокой производительностью, чувствительностью и специфичностью. В данном обзоре рассмотрены особенности технологий одномолекулярного секвенирования, предлагаемых компаниями “PacBio” и “Oxford Nanopore Technologies”, и применение технологий одномолекулярного секвенирования для целей транскриптомного анализа, включая анализ изоформ транкриптов. Также обсуждаются перспективы и ограничения их использования для количественного профилирования транскриптома

    Идентификация рибосомных футпринтов на электрофоретическом геле при профилировании транслатома: использование ДНК-маркёров

    No full text
    The commercial DNA ladder was tested as a substitute for RNA size standards to identify ribosomal footprints (RNA fragments of about 30 nucleotides long) on an electrophoretic polyacrylamide gel for the purposes of translatome profiling. It has been found that 25 and 35 nucleotides long synthetic RNA oligonucleotides do migrate slower than the synthetic DNA oligonucleotides of the matching length and sequences and their positions on the gel coincide with those of 30 and 40 nucleotides long DNA oligonucleotides, correspondingly, of the commercial IDT 20/100 DNA oligo length standards. By using this DNA ladder and RNA isolated from the preparation enriched in ribosomes (obtained by fractionating on MicroSpin S-400 columns the HepG2 cell lysate treated with RNase I), the position of a band of putative ribosomal footprints can be identified on a gel that has been verified by measuring in an RNA-seq experiment the length of RNA fragments extracted from the band.Коммерческие ДНК-маркёры тестировали как замену РНК-стандартов длины молекулы для идентификации рибосомных футпринтов (фрагментов РНК длиной около 30 нуклеотидов) на электрофоретическом полиакриламидном геле при профилировании транслатома. Было обнаружено, что синтетические РНК-олигонуклеотиды длиной 25 и 35 нуклеотидов мигрируют медленнее, чем синтетические ДНК-олигонуклеотиды соответствующей длины и последовательностей, и их положение на геле совпадает с положением ДНК- олигонуклеотидов длиной 30 и 40 нуклеотидов соответственно из коммерческого набора стандартов длин ДНК-олигонуклеотидов «IDT 20/100 DNA oligo length standards». Используя данный набор и РНК, выделенную из препарата, обогащенного рибосомами (полученного фракционированием на колонках MicroSpin S-400 клеточного лизата HepG2, обработанного РНКазой I), можно идентифицировать положение полосы предполагаемых рибосомных футпринтов на геле, что было подтверждено измерением длины фрагментов РНК, выделенных из полосы, при проведении их секвенирования методом RNA-seq

    Гены «стахановцы» 18 хромосомы человека, отсутствующие белки и не охарактеризованные белки в ткани печени и клеточной линии HepG2

    No full text
    Missing (MP) and functionally uncharacterized proteins (uPE1) comprise less than 5% of the total number of proteins encoded by human Chr18 genes. Within half a year, since the January 2020 version of NextProt, the number of entries in the MP+uPE1 datasets changed, mainly due to the achievements of antibody-based proteomics. Assuming that the proteome is closely related to the transcriptome scaffold, quantitative PCR, Illumina HiSeq, and Oxford Nanopore Technology were applied to characterize the liver samples of three male donors in comparison with the HepG2 cell line. The data mining of the Expression Atlas (EMBL-EBI) and the profiling of biopsy samples by using orthogonal methods of transcriptome analysis have shown that in HepG2 cells and the liver, the genes encoding functionally uncharacterized proteins (uPE1) are expressed as low as for the missing proteins (less than 1 copy per cell), except the selected cases of HSBP1L1, TMEM241, C18orf21, and KLHL14. The initial expectation that uPE1 genes might be expressed at higher levels than MP genes, was compromised by severe discrepancies in our semi-quantitative gene expression data and in public databanks. Such discrepancy forced us to revisit the transcriptome of Chr18, the target of the Russian C-HPP Consortium. Tanglegram of highly expressed genes and further correlation analysis have shown the severe dependencies on the mRNA extraction method and the analytical platform. Targeted gene expression analysis by quantitative PCR (qPCR) and high-throughput transcriptome profiling (Illumina HiSeq and ONT MinION) for the same set of samples from normal liver tissue and HepG2 cells revealed the detectable expression of 250+ (92%) protein-coding genes of Chr18 (at least one method). The expression of slightly more than 50% protein-coding genes was detected simultaneously by all three methods. Correlation analysis of the gene expression profiles showed that the grouping of the datasets depended almost equally on both the type of biological material and the experimental method, particularly cDNA/mRNA isolation and library preparation.Отсутствующие белки и функционально не охарактеризованные белки (в англоязычной литературе обозначенные как missing (MP) и functionally uncharacterized proteins (uPE1), соответственно) составляют менее 5% от общего числа белков, кодируемых генами 18 хромосомы человека. В течение полугода, начиная с января 2020 года, в версии NextProt выросло количество записей в наборах данных MP+uPE1. Подобные изменения обусловлены преимущественно достижениями протеомики на основе антител. В данной работе количественная ПЦР, технологии секвенирования Illumina HiSeq и Oxford Nanopore Technologies были применены для сравнительного анализа транскриптомного профиля образцов печени трех доноров мужского пола и клеточной линии HepG2. Анализ данных атласа экспрессии (Expression Atlas, EMBL-EBI) и полученных результатов по биологическим образцам с использованием ортогональных методов анализа транскриптома показал, что в клетках печени и HepG2 уровень экспрессии генов, кодирующих функционально не охарактеризованные белки (uPE1), находится на таком же низком уровне, как и в случае генов MP (в количестве менее 1 копии на клетку). Исключение составили несколько генов: HSBP1L1, TMEM241, C18orf21 и KLHL14. Согласно существенным расхождениям в ранее полученных полуколичественных данных по экспрессии генов и данным в открытых базах данных, изначально предполагалось, что экспрессия генов uPE1 может быть выше, чем генов MP. Подобное расхождение побудило обратиться к транскриптому 18 хромосомы человека, являющейся целевой для России в проекте «Протеом человека». Полученные результаты о наиболее экспрессируемых генах и дальнейший корреляционный анализ показал существование зависимости от метода экстракции мРНК и аналитической платформы. Анализ экспрессии целевых генов 18 хромосомы с применением количественной ПЦР (qPCR) и методов высокопроизводительного профилирования транскриптома (Illumina HiSeq и ONT MinION) для одинаковых наборов образцов нормальной ткани печени и клеточной линии HepG2 выявил более 250 (92%) белок-кодирующих генов, детектируемых хотя бы одним методом. Экспрессия более чем 50% белок-кодирующих генов была детектирована всеми тремя методами. Корреляционный анализ профилей экспрессии генов показал, что результаты «группируются» в зависимости от типа биологического материала и экспериментальных методов, в частности от способа подготовки библиотеки (выделения кДНК, мРНК). Зависимость от выбора способа биоинформатической обработки была отмечена в значительно меньшей степени
    corecore