63 research outputs found

    The statistical stability of consensus independent component analysis for RNA-SEQ data in cancer research

    Get PDF
    Independent component analysis (ICA) became a part of the standard machine learning pipeline for genomics data analysis. The approach allows to correct technical biases and batch effects in transcriptomics datasets. Separated signals are successfully used to characterize biological functions, their weights might be used for diagnostics (cancer subtypes classification) and prognostics (survival prediction). Using weights of independent components as features for downstream analysis requires high reproducibility of decomposition. Here we investigated the stability of extracted components depending on ICA parameters and validated the optimal number of parallel consensus ICA runs that provided reproducible deconvolution. Also, we estimated the effect of parallel runs on the quality of lung cancer type classification (LUSC/LUAD) and gene enrichment analysis results. Finally, we estimated the boundary values for the number of components that allows detecting biologically relevant signals in smaller patient cohorts

    The Correlation-Based Method for the Movement Compensation in the Analysis of the Results of FRAP Experiments

    Get PDF
    This paper presents a computational algorithm for the detection and compensation for intracellular movement in the FRAP experiments with focal adhesions in living cells. The developed approach is based on the calculation of correlation coefficient. It was validated on the series of the experimental datasets and shows the successful results in the comparison with other widelyestablished methods

    Комплексный анализ данных при исследовании сложных биомолекулярных систем

    Get PDF
    The biomolecular technology progress is directly related to the development of effective methods and algorithms for processing a large amount of information obtained by modern high-throughput experimental equipment. The priority task is the development of promising computational tools for the analysis and interpretation of biophysical information using the methods of big data and computer models. An integrated approach to processing large datasets, which is based on the methods of data analysis and simulation modelling, is proposed. This approach allows to determine the parameters of biophysical and optical processes occurring in complex biomolecular systems. The idea of an integrated approach is to use simulation modelling of biophysical processes occurring in the object of study, comparing simulated and most relevant experimental data selected by dimension reduction methods, determining the characteristics of the investigated processes using data analysis algorithms. The application of the developed approach to the study of bimolecular systems in fluorescence spectroscopy experiments is considered. The effectiveness of the algorithms of the approach was verified by analyzing of simulated and experimental data representing the systems of molecules and proteins. The use of complex analysis increases the efficiency of the study of biophysical systems during the analysis of big data.Развитие биомолекулярных технологий напрямую связано с разработкой эффективных методов и алгоритмов обработки большого объема информации, получаемой с помощью современного высокопроизводительного экспериментального оборудования. В числе приоритетных задач – разработка перспективных инструментов анализа и интерпретации биофизической информации с использованием методов анализа больших данных и компьютерных моделей.Предложен комплексный подход к обработке больших наборов данных на основе методов интеллектуального анализа данных и имитационного моделирования, позволяющий определять параметры биофизических и оптических процессов, происходящих в сложных биомолекулярных системах. Идея комплексного подхода состоит в использовании имитационного моделирования биофизических процессов, протекающих в объекте исследования, сравнении отобранных методами снижения размерности смоделированных и наиболее информативных экспериментальных данных, определении характеристик исследуемых процессов с применением алгоритмов интеллектуального анализа данных.Рассмотрено применение разработанного подхода для исследования бимолекулярных систем в экспериментах флуоресцентной спектроскопии. Эффективность алгоритмов подхода проверена в ходе анализа смоделированных и экспериментальных данных, представляющих системы молекул и белков. Применение комплексного анализа повышает эффективность исследования биофизических систем в ходе анализа больших данных

    Вычислительный подход и программный пакет RNAexploreR для группировки молекул РНК генов человека по их экзонным признакам

    Get PDF
    The study on the exon combinatoric rules of human genes during the process of splicing is of great interest for the diagnosis and treatment of cancer. A certain part of the research is aimed at developing reliable prediction models for global exon combinatorics during the formation of mature RNA. The primary task is to develop standards or uniform systematic statistical approaches to the analysis and interpretation of possible exon sequences of genes.A computational approach is proposed to group alternative splicing events in primary messenger RNA of human genes with the aim of determining the gene correspondence or molecule class. The method consists of reducing the dimension of the exon feature space and combining closely located exons into a limited number of classes, replacing the exon pathways of RNA generation with sequences of corresponding exon class labels, calculating the distances between RNA transcripts by some measure of similarity, and associating closely spaced RNA objects into clusters. The performance evaluation of developed algorithms has been done using the examples of RNA molecules of selected nonhomologous human genes and human hybrid oncogene RUNX1/RUNX1T1. The mean accuracy of the assignment of the transcript to given gene is about 99,5 % for the considered nonhomologous pairs of genes.A software package and web application RNAexploreR, integrating the implemented algorithms for the analysis of alternative splicing of human gene RNA products, have been developed. The proposed algorithms and software can be used to study the organization and functioning of both aberrant and normal human genes.Изучение правил комбинаторики экзонов генов человека во время сплайсинга представляет огромный интерес для диагностики и лечения раковых заболеваний. Определенная часть исследований направлена на разработку надежных моделей предсказания глобальной комбинаторики экзонов при образовании зрелой РНК. Первоочередной задачей является разработка стандартов или единых систематизированных статистических подходов к анализу и интерпретации возможных экзонных последовательностей генов.Предложен вычислительный подход к предсказанию событий альтернативного сплайсинга в первичных мРНК генов человека, методика которого состоит в снижении размерности пространства экзонных признаков и объединении близко расположенных экзонов в ограниченное число классов, замене экзонных путей генерации РНК на последовательности соответствующих меток классов экзонов, вычислении расстояний между транскриптами РНК по некоторой мере сходства, объединении близкорасположенных объектов РНК в кластеры. Проверка работоспособности разработанных алгоритмов выполнена на примере наборов молекул РНК отобранных негомологичных генов человека и гибридного онкогена RUNX1-RUNX1T1 человека. Точность предсказания разработанного подхода составляет 99.5% для рассмотренных негомологичных пар генов.Разработан программный пакет и веб-приложение RNAexploreR, интегрирующие реализованные алгоритмы анализа альтернативного сплайсинга РНК-продуктов генов человека. Предложенные алгоритмы и программное обеспечение могут быть использованы для изучения организации и функционирования как аберрантных, так и нормальных генов человека

    ПРОГРАММНЫЙ ПАКЕТ CellDataMiner ДЛЯ АНАЛИЗА ЛЮМИНЕСЦЕНТНЫХ ИЗОБРАЖЕНИЙ РАКОВЫХ КЛЕТОК

    Get PDF
    The paper presents the software package CellDataMiner for data analysis of lumencent images of cancer cells. The comparative analysis of classification and clustering methods is carried out. The most sufficient of them are implemented in the software. The software package is tested on the dataset of the experimental images of breast cancer.Предлагается программный пакет CellDataMiner для анализа люминесцентных изображений раковых клеток. Проводится сравнительный анализ алгоритмов классификации и кластеризации данных с целью реализации в пакете наиболее эффективных из них. Работоспособность программного обеспечения проверяется на экспериментальных данных, представляющих результаты по исследованию опухоли молочной железы

    АНАЛИЗ ЭКСПРЕССИИ ГЕНОВ В РЕЗУЛЬТАТЕ ВОЗДЕЙСТВИЯ ИНТЕРФЕРОНА IFN-γ НА КЛЕТКУ С ИСПОЛЬЗОВАНИЕМ ПРОГРАММНОГО ПАКЕТА GeneExpressionAnalyser

    Get PDF
    The software package GeneExpressionAnalyser for analysis of the DNA microarray experi-mental data has been developed. The algorithms of data analysis, differentially expressed genes and biological functions of the cell are described. The efficiency of the developed package is tested on the published experimental data devoted to the time-course research of the changes in the human cell un-der the influence of IFN-γ on melanoma. The developed software has a number of advantages over the existing software: it is free, has a simple and intuitive graphical interface, allows to analyze different types of DNA microarrays, contains a set of methods for complete data analysis and performs effec-tive gene annotation for a selected list of genes.Предлагается программный пакет GeneExpressionAnalyser для анализа данных, полученных в ходе проведения экспериментов с использованием биочипов ДНК. Детально рассмотрены алгоритмы предварительного анализа данных, выделения дифференциально-выраженных генов и анализа биологических функций клетки. Работоспособность пакета исследуется на примере опубликованных экспериментальных данных, представляющих результаты эксперимента по ис-следованию изменений экспрессии генов в клетке меланомы под воздействием интерферона IFN-? с течением времени
    corecore