4 research outputs found

    An谩lisis multivariado aplicado a la representaci贸n de datos sint茅ticos de secuenciaci贸n de ARN

    Get PDF
    Tesis (Maestr铆a en Estad铆stica Aplicada) -- Universidad Nacional de C贸rdoba. Facultad de Ciencias Econ贸micas. Escuela de Graduados; Argentina, 2017.La secuenciaci贸n de alto rendimiento de ARN genera grandes bases de datos con informaci贸n que puede ser utilizada con diferentes objetivos. Una de las aplicaciones m谩s utilizada consiste en resumir las lecturas de las secuencias agreg谩ndolas en funci贸n de una unidad de inter茅s tal como gen, ex贸n o transcript . En este tipo de an谩lisis se obtienen matrices con datos de conteos correspondientes a cada individuo en estudio (filas) y asignados a una particular unidad de inter茅s (columnas). En general el n煤mero de individuos es muy peque帽o en relaci贸n al n煤mero de variables y los conteos presentan un rango de dispersi贸n muy amplio. En esta tesis se comparan t茅cnicas de an谩lisis multivariado exploratorio a 2 y 3 v铆as de clasificaci贸n que contemplan la naturaleza de los datos obtenidos en experimentos de secuenciaci贸n de ARN. Utilizando datos sint茅ticos generados con la t茅cnica de plasmodios se comparan transformaciones a los datos y medidas de disimilaridad empleadas en el an谩lisis de cluster jer谩rquico, an谩lisis de escalamiento multidimensional m茅trico y no m茅trico y en el an谩lisis factorial multiple. La transformaci贸n de los conteos originales a trav茅s de funciones que utilizan logaritmo o el uso de disimilaridades basadas en correlacion de Spearman o disimilaridad Poisson rescata la estructura natural de las muestras en todos los m茅todos de an谩lisis utilizados. La mera estandarizaci贸n o normalizaci贸n de los conteos no genera representaciones confiables. La elecci贸n de la mejor medida debe considerar el nivel de relaci贸n se帽al-ruido ya que no todas las medidas muestran la configuraci贸n natural de la muestras en funci贸n de la cantidad de transcripts expresados o no diferencialmente. Este aspecto debe considerarse al momento de representar las muestras utilizando todos transcripts obtenidos o filtrando por expresi贸n diferencial.Fil: Reeb, Pablo Daniel. Universidad Nacional de C贸rdoba. Facultad de Ciencias Econ贸micas. Escuela de Graduados; Argentina
    corecore