Article thumbnail

Desarrollo de una GUI para el análisis de datos de secuenciación genómica

By Susana Hernández Ballesteros

Abstract

RNA-seq es una tecnología perteneciente al grupo de secuenciaciones de nueva generación (Next Generation Sequencing, NGS), que proporciona información sobre el ARN y, en particular, sobre la expresión de genes presentes en dicho ARN. Se trata de una tecnología ampliamente utilizada para realizar el análisis de la expresión diferencial de genes. Sin embargo, la principal dificultad de este tipo de análisis reside en la falta de un workflow unificado, debido a la gran cantidad de herramientas que existen y que su uso no es sencillo para los usuarios no expertos en informática. El uso de estas herramientas a día de hoy se realiza mediante la línea de comandos UNIX y es necesario conocer los formatos de de los ficheros que se utilizan en cada paso del análisis RNA-seq. El objetivo de este Trabajo de Fin de Grado es crear un workflow que integre algunas de las herramientas empleadas en cada paso del análisis RNA-seq y permitir su utilización mediante una Interfaz Gráfica de Usuario (GUI) que facilite realizar el análisis de expresión diferencial de genes. Esto se ha conseguido en dos partes. Por una parte, se ha realizado un estudio exhaustivo de las herramientas disponibles en el estado del arte para determinar cuales son las más utilizadas por los usuario finales. Las herramientas seleccionadas son: Bowtie, Samtools, HTSeq y DESeq. Además, se ha diseñado y desarrollado contador de expresión génica que trata de paliar las deficiencias de algunas de las herramientas más populares. Por otra parte, se ha desarrollado una aplicación web que permite realizar el análisis de expresión diferencial de varias condiciones experimentales simultáneamente, integra todas las herramientas seleccionadas, permite determinar las opciones de cada una de ellas y proporciona al usuario una visualización gráfica de los resultados del análisis de expresión diferencial. La Interfaz Gráfica de Usuario utiliza las librerías Shiny y Shinydashboard lo que mejora la usabilidad y la experiencia de usuario en comparación a la utilización de las herramientas por la línea de comandos o a través de herramientas de integración demasiado sofisticadas que no llegan a ser útiles para el usuario no experto. La aplicación ha sido diseñada e implementada de acuerdo al patrón de arquitectura Modelo-Vista-Controlador (MVC). La funcionalidad de la vista y el controlador vienen proporcionados por la estructura que sigue la implementación con Shiny y Shinydashboard. El modelo queda definido por las herramientas utilizadas para el análisis y por el formato estándar de los ficheros generados durante el análisis de expresión diferencial de genes. Finalmente, los requisitos funcionales y no funcionales de la aplicación han sido validados y verificados realizando pruebas con datos RNA-seq simulados y experimentos reales.RNA-seq is a Next-Generation Sequencing (NGS) technology that provides information about RNA and in particular the gene expression present in a sample of RNA. It is a widespread and useful method for the analysis of differential gene expression. However, the large number of tools available and the lack of an unified workflow make the RNA data analysis very difficult to non-experts. The objective of this Masters Thesis is to create a work flow that integrates some of the most popular tools used in each step of RNA-seq analysis and allow its use through a Graphical User Interface (GUI) that facilitates the gene differential expression analysis. This is achieved by completing two main tasks. First, conducting a study of the state-of-the-art RNA-seq tools in order to determine which tools are the most used by the end user, learn how to use them. Namely, the selected tools are: Bowtie, Samtools, HTSeq and DESeq. A tool for gene expression counting was also implemented and included in the workflow in order to alleviate some disadvantages of the existing algorithms. Second, developing a web application that allows the analysis of differential gene expression of various experimental conditions simultaneously. The GUI integrates all tools selected and allow tuning the configuration parameters of each tool. Additionally, it provides a graphical display with the results obtained through the analysis. The GUI uses the R Shiny and Shinydashboard libraries, and it improves usability and user experience compared to the alternative of using command-line tools or sophisticated integration tools not suitable for non-experienced users. The application was designed and implemented according to a model-view-controller architectural pattern. The view and controller functionalities are directly provided by Shiny and Shinydashboard libraries. The model consists of the selected tools, and the data model is defined by the standard file formats generated during the analysis of differential gene expression. Finally, functional and non-functional requisites of the application were validated using RNA-seq data from simulations and real experiments

Topics: Interfaces gráficas (Informática), Bioinformática, Informática
Year: 2016
OAI identifier: oai:repositorio.uam.es:10486/670588
Provided by: Biblos-e Archivo

Suggested articles


To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.