2 research outputs found

    The impact of RNA-seq alignment pipeline on detection of differentially expressed genes

    No full text
    RNA-seq data analysis pipelines are generally composed of sequence alignment, expression quantification, expression normalization, and differentially expressed gene (DEG) detection. Each step has numerous specific tools or algorithms, so we cannot explore all combinatorial pipelines and provide a comprehensive comparison of pipeline performance. To understand the mechanism of RNA-seq data analysis pipelines and provide some useful information for pipeline selection, we believe it is necessary to analyze the interactions among pipeline components. In this paper, by combining different alignment algorithms with the same quantification, normalization, and DEG detection tools, we construct nine RNA-seq pipelines to analyze the impact of RNA-seq alignment on downstream applications of gene expression estimates. Specifically, we find moderate linear correlation between the number of DEGs detected and the percentage of reads aligned with zero mismatch

    Expresión génica en mieloma múltiple: análisis de datos de RNA-seq y microarrays en combinación con estudios de metaanálisis y predicción de respuesta al tratamiento

    Get PDF
    [ES] El mieloma múltiple (MM) es una neoplásia hematológica que presenta una gran variabilidad clínica como consecuencia de su heterogeneidad genética. Así, desde las etapas precursoras del MM conviven en la médula ósea múltiples clones celulares genéticamente distintos y por tanto, con capacidad diferente para sobrevivir y resistir a la acción de factores externos como son los tratamientos. Esta diversidad, ha conducido en los últimos 20 años al desarrollo de nuevos fármacos con mecanismos de acción muy diferentes a la quimioterapia clásica, lo que ha contribuído a prolongar notablemente la supervivencia global de las personas afectadas por esta patología. Igualmente, en las últimas décadas ha habido grandes progresos en el descubrimiento de los procesos biológicos implicados en el MM, derivados, principalmente, de la inmensa información aportada en campos como la transcriptómica gracias a tecnologías de análisis masivo de datos como los microarrays o la RNA-seq. Con estos antecedentes, en el presente trabajo se ha procedido a la búsqueda de las firmas de expresión génica de diferentes compuestos utilizados en el tratamiento del MM, así como a la determinación de genes implicados en la respuesta de estos fármacos en pacientes con esta patología. Para ello, se propuso en un primer lugar, una guía para el análisis de datos de RNA-seq mediante el desarrollo de un flujo de análisis o pipeline, en el que se determinaron los métodos y algoritmos más adecuados para el procesamiento de datos de esta tecnología. Así, se llevó a cabo la evaluación del rendimiento de 192 pipelines a nivel de expresión génica cruda y de 17 métodos a nivel de expresión génica diferencial, de manera que finalmente fueron establecidos los pipelines y algoritmos con mejores índices de precisión y exactitud a la hora de la determinación de la expresión génica a ambos niveles. En una siguiente etapa se realizó un estudio comparativo entre la RNA-seq y el microarray transcriptómico HTA 2.0 de Affymetrix, para establecer cuál de las dos tecnologías muestra un mayor rendimiento en estudios de expresión génica. Tras el establecimiento de las metodologías óptimas de análisis, se procedió a la determinación de los perfiles de expresión génica asociados a 12 fármacos antimieloma mediante técnicas de metaanálisis en líneas celulares. Esto condujo a la especificación de una firma génica para cada uno de los compuestos analizados, que fue asociada posteriormente a posibles mecanismos de acción o de quimiorresistencia. Adicionalmente, también se llevó a cabo la definición de los perfiles de expresión génica asociados a la respuesta a tres esquemas de tratamiento en pacientes con MM al momento del diagnóstico, siendo comprobada, en un último paso, la eficiencia de estos perfiles de expresión en la predicción de la respuesta propuestos a través del uso de modelos estadísticos predictivos
    corecore