Search CORE

4 research outputs found

Identificación de relaciones entre rendimientos y variables ambientales vía árboles de clasificación y regresión

Author: Balzarini Monica Graciela
Bruno Cecilia Ines
Rosales Heredia María Soleana de Las Mercedes
Publication venue: Interciencia
Publication date: 01/12/2010
Field of study

En investigaciones agrícolas son frecuentes los ensayos multiambientales (EMA) para la comparación de rendimientos de varios genotipos en múltiples ambientes. Para caracterizar los ambientes es común registrar covariables meteorológicas y/o de manejo con potencialidad de explicar relaciones entre rendimientos y ambientes. La contribución relativa de las distintas covariables suele analizarse vía técnicas estadísticas univariadas, principalmente prueba t y análisis de regresión. No obstante, los árboles de clasificación y de regresión, algoritmos CART, constituyen una aproximación multivariada alternativa para identificar variables ambientales de más impacto en los rendimientos. Lo CART presentan menos restricciones para su implementación que las técnicas de análisis basadas en los modelos lineales clásicos. En el presente trabajo se evalúa el desempeño de algoritmos CART comparado con los procedimientos clásicos de análisis en una base de datos de rendimientos de soja proveniente de un EMA inserto en la región sojera argentina a través de los ambientes. Los resultados muestran que los algoritmos CARTconstituyen, debido a su bajo error de predicción, una técnica robusta para predecir la variabilidad en los rendimientos como respuesta a variaciones ambientales. El estudio resalta la necesidad de contemplar la multicolinealidad al trabajar con covariables ambientales y modelos clásicosFil: Rosales Heredia, María Soleana de Las Mercedes. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Departamento de Desarrollo Rural. Area de Estadística y Biometría; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Bruno, Cecilia Ines. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Departamento de Desarrollo Rural. Area de Estadística y Biometría; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Departamento de Desarrollo Rural. Area de Estadística y Biometría; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentin

CONICET Digital

Estrategias estadístico-computacionales avanzadas para análisis de expresión de proteínas/genes en cáncer. Advanced statistical and computational strategies for protein/gene expression analysis in cancer.

Author: Amiune Hernán Miguel
Balzarini Mónica
Bruno Cecilia
Fernández Elmer Andrés
Girotti María Romina
Llera Andrea Sabina
Podhajcer Osvaldo
Rosales Heredia María Soleana de las Mercedes
Publication venue
Publication date: 01/03/2008
Field of study

El objetivo de este proyecto, enmarcado en el área de metodología de análisis en bioingeniería-biotecnología aplicadas al estudio del cancer, es el análisis y caracterización a través modelos estadísticos con efectos mixtos y técnicas de aprendizaje automático, de perfiles de expresión de proteínas y genes de las vías metabolicas asociadas a progresión tumoral. Dicho estudio se llevará a cabo mediante la utilización de tecnologías de alto rendimiento. Las mismas permiten evaluar miles de genes/proteínas en forma simultánea, generando así una gran cantidad de datos de expresión. Se hipotetiza que para un análisis e interpretación de la información subyacente, caracterizada por su abundancia y complejidad, podría realizarse mediante técnicas estadístico-computacionales eficientes en el contexto de modelos mixtos y técnias de aprendizaje automático. Para que el análisis sea efectivo es necesario contemplar los efectos ocasionados por los diferentes factores experimentales ajenos al fenómeno biológico bajo estudio. Estos efectos pueden enmascarar la información subycente y así perder informacion relavante en el contexto de progresión tumoral. La identificación de estos efectos permitirá obtener, eficientemente, los perfiles de expresión molecular que podrían permitir el desarrollo de métodos de diagnóstico basados en ellos. Con este trabajo se espera poner a disposición de investigadores de nuestro medio, herramientas y procedimientos de análisis que maximicen la eficiencia en el uso de los recursos asignados a la masiva captura de datos genómicos/proteómicos que permitan extraer información biológica relevante pertinente al análisis, clasificación o predicción de cáncer, el diseño de tratamientos y terapias específicos y el mejoramiento de los métodos de detección como así tambien aportar al entendimieto de la progresión tumoral mediante análisis computacional intensivo

Cor-Ciencia

Producción Académica

Producción Académica UCC

Estrategias estadístico-computacionales avanzadas para análisis de expresión de proteínas/genes en cáncer. Advanced statistical and computational strategies for protein/gene expression analysis in cancer.

Author: Amiune Hernán Miguel
Balzarini Mónica
Bruno Cecilia
Fernández Elmer Andrés
Girotti María Romina
Llera Andrea Sabina
Podhajcer Osvaldo
Rosales Heredia María Soleana de las Mercedes
Publication venue
Publication date: 01/03/2008
Field of study

Producción Académica

Desarrollos estadísticos para el procesamiento de información genómica masiva en agro-biotecnología. Statistical developments for processing massive genomic information in agro-biotechnology.

Author: Amiune Hernán
Arroyo Alejandra
Balzarini Mónica
Bonamico Natalia Cecilia
Bruno Cecilia
Di Renzo Miguel
Fernandez Elmer
Gonzalez Laura
Ibañez Mercedes
Molina María Gabriela de los Angeles
Piccardi Mónica
Rosales Heredia María Soleana de las Mercedes
Tablada Margot
Publication venue
Publication date
Field of study

Nuevas biotecnologías, como los marcadores de la molécula de ADN, permiten caracterizar el genoma vegetal. El uso de la información genómica producida para cientos o miles de posiciones cromosómicas permite identificar genotipos superiores en menos tiempo que el requerido por la selección fenotípica tradicional. La mayoría de los caracteres de las especies vegetales cultivadas de importancia agronómica y económica, son controlados por poli-genes causantes de un fenotipo con variación continua, altamente afectados por el ambiente. Su herencia es compleja ya que resulta de la interacción entre genes, del mismo o distinto cromosoma, y de la interacción del genotipo con el ambiente, dificultando la selección. Estas biotecnologías producen bases de datos con gran cantidad de información y estructuras complejas de correlación que requieren de métodos y modelos biométricos específicos para su procesamiento. Los modelos estadísticos focalizados en explicar el fenotipo a partir de información genómica masiva requieren la estimación de un gran número de parámetros. No existen métodos, dentro de la estadística paramétrica capaces de abordar este problema eficientemente. Además los modelos deben contemplar no-aditividades (interacciones) entre efectos génicos y de éstos con el ambiente que son también dificiles de manejar desde la concepción paramétrica. Se hipotetiza que el análisis de la asociación entre caracteres fenotípicos y genotipos moleculares, caracterizados por abundante información genómica, podría realizarse eficientemente en el contexto de los modelos mixtos semiparamétricos y/o de métodos no-paramétricos basados en técnicas de aprendizaje automático. El objetivo de este proyecto es desarrollar nuevos métodos para análisis de datos que permitan el uso eficiente de información genómica masiva en evaluaciones genéticas de interés agro-biotecnológico. Los objetivos específicos incluyen la comparación, respecto a propiedades estadísticas y computacionales, de estrategias analíticas paramétricas con estrategias semiparamétricas y no-paramétricas. Se trabajará con aproximaciones por regresión del análisis de loci de caracteres cuantitativos bajo distintas estrategias y escenarios (reales y simulados) con distinto volúmenes de datos de marcadores moleculares. En el área paramétrica se pondrá especial énfasis en modelos mixtos, mientras que en el área no paramétrica se evaluarán algoritmos de redes neuronales, máquinas de soporte vectorial, filtros multivariados, suavizados del tipo LOESS y métodos basados en núcleos de reciente aparición. La propuesta semiparamétrica se basará en una estrategia de análisis en dos etapas orientadas a: 1) reducir la dimensionalidad de los datos genómicos y 2) modelar el fenotipo introduciendo sólo las señales moleculares más significativas. Con este trabajo se espera poner a disposición de investigadores de nuestro medio, nuevas herramientas y procedimientos de análisis que permitan maximizar la eficiencia en el uso de los recursos asignados a la masiva captura de datos genómicos y su aplicación en desarrollos agro-biotecnológicos

Cor-Ciencia