Integración de datos de expresión génica asociados a líneas celulares de cánceres: un enfoque utilizando la metodología STATIS-ACT, métodos biplot y minería de textos
Resumen - Lista de guras - Lista de tablas - Introducción - Objetivo general - Objetivos especícos - 1. Marco Teórico - 1.1 Nuevas perspectivas en la investigación sobre cáncer - 1.2 Análisis de datos económicos - 1.2.1 Normalización de datos - 1.3 Ontología de genes 1.4 Los métodos de k-tablas - 1.4.1 STATIS - 1.4.1.1 Interestructura - 1.4.1.2 Compromiso - 1.4.1.3 Intraestructura - 1.4.2 STATIS-Dual - 1.4.2.1 Interestructura - 1.4.2.2 Compromiso - 1.4.2.3 Intraestructura - 1.4.3 Análisis Parcial Triádico - 1.5 Medidas de calidad de representación - 1.5.1 Calidad de representación de las tablas - 1.5.2 Calidad de representación de los individuos - 1.5.3 Calidad de representación de las variables - 1.6 Variabilidad muestral - 1.7 Representación Biplot para medir interacción entre individuos y variables - 1.7.1 Formulación - 1.8 Redes y Grafos - 2. Ilustración de la metodología de análisis: integración de datos económicos provenientes de líneas celulares de cáncer del panel NCI60 - 2.1 Conjunto de Datos NCI60 - 2.2 Procesamiento de Datos - 2.2.1 Análisis de ontologías: integración de datos en una red - 2.3 Resultados - 2.3.1 Interestructura - 2.3.2 Configuración Compromiso - 2.3.3 Proyección de genes usando Biplot - 2.3.4 Selección de genes comunes a todas las tablas usando Biplot - 2.4 Análisis de ontologías: red de relaciones de genes seleccionados y genes activados ante la presencia de distintos tejidos - 2.5 Discusión - Conclusiones - Bibliografía - AnexoLos datos económicos, donde se analiza la expresión de miles de genes, proteínas, metabolitos en distintas muestras biológicas, comprenden una gran cantidad de áreas de aplicación y su estudio ha crecido de manera exponencial en los últimos a~nos. La integración de datos es uno de los principales objetivos actuales en bio-ciencias, dado que es común medir expresión simultánea de genes, proteínas y metabolitos o bien tener mediciones de la expresión genética de las mismas muestras en diferentes plataformas de análisis, generando, por lo tanto, distintas fuentes de información. La integración implica el meta-análisis de sus resultados o el análisis simultáneos de los datos originales.
En el marco de este trabajo, se realiza una propuesta metodológica para abordar el problema de estudio y comparación de datos genéticos provenientes de distintas plataformas de microarreglos y el problema de selección de genes basada en los métodos estadísticos de k-tablas y Biplot. Se realiza una aplicación de la metodología propuesta a datos de expresión genética de 60 líneas celulares de 9 tipos diferentes de cáncer provenientes de cuatro plataformas de análisis del panel NCI-60.Fil: Zingaretti, María Laura. Universidad Nacional de Córdoba; Argentina