6 research outputs found

    Modelización de la Productividad vía Métodos Computacionalmente Intensivos

    Get PDF
    Los rendimientos de soja (Glycine max (L.) Merr.) son variables aún en pequeñas áreas. Los estudios observacionales, en campos en producción, permiten captar la variación de rendimiento tal como se presentan en la realidad, ya que esta es explicada por múltiples variables, principalmente edáficas y meteorológicas. El uso de algoritmos de clasificación y regresión (CART) posibilita el análisis de variaciones de rendimiento en función de variables explicatorias que pueden estar correlacionadas y aún relacionarse de modo no lineal con el rendimiento. Los algoritmos CART son métodos computacionalmente intensivos basado en particiones recursivas de casos en función de variables predictoras de una variable de interés. El objetivo del presente estudio fue identificar vía la implementación de algoritmos CART las variables edáficas y climáticas que permiten predecir el rendimiento del cultivo de soja en el Sur de Santa Fe, así como descubrir los umbrales que pueden limitar su rendimiento en la región. Los métodos CART son una potente herramienta para la predicción de los rendimientos provenientes de estudios observacionales. Los resultados consensuados por ambos algoritmos sugieren que la compactación edáfica, expresado como Mdelta constituye la variable de mayor impacto para explicar la variabilidad del rendimiento del cultivo en la región.Soybean (Glycine max (L.) Merr.) yields show high variability even within a small crop area. Observational studies at field scale help explain yield variability under non-experimental conditions. Variability depends on multiple variables, mainly of soil and climate. Classification and regression tree algorithms (CART) were used to analyze yield variation based on explanatory variables that can be correlated and even related through nonlinear trends with yield. CART algorithms represent methods computationally intensive since they are based on recursive partitions of records according to different variables potentially used as predictor of the response of interest. Our objective was to identify, by CART, soil and climatic variables that can predict yield in soybean fields in South of Santa Fe and to determine their thresholds that can limit the crop yield. To build classification trees, a nominal variable was generated for yield from its median. Regression trees were calculated by using yield as a continuous variable. The results suggested that soil compaction is a variable with high potential to limit the crop in the region. CARTs are valuable tools to predict yield from observational studies. The outcomes agreed by both algorithms suggest that soil compaction, expressed as Mdelta are the variables with the greatest impact in explaining the variability in crop yield in the region.Sociedad Argentina de Informática e Investigación Operativ

    Identificación de relaciones entre rendimientos y variables ambientales vía árboles de clasificación y regresión

    No full text
    En investigaciones agrícolas son frecuentes los ensayos multiambientales (EMA) para la comparación de rendimientos de varios genotipos en múltiples ambientes. Para caracterizar los ambientes es común registrar covariables meteorológicas y/o de manejo con potencialidad de explicar relaciones entre rendimientos y ambientes. La contribución relativa de las distintas covariables suele analizarse vía técnicas estadísticas univariadas, principalmente prueba t y análisis de regresión. No obstante, los árboles de clasificación y de regresión, algoritmos CART, constituyen una aproximación multivariada alternativa para identificar variables ambientales de más impacto en los rendimientos. Lo CART presentan menos restricciones para su implementación que  las técnicas de análisis basadas en los modelos lineales clásicos. En el presente trabajo se evalúa el desempeño de algoritmos CART comparado con los procedimientos clásicos de análisis en una base de datos de rendimientos de soja proveniente de un EMA inserto en la región sojera argentina a través de los ambientes. Los resultados muestran que los algoritmos CARTconstituyen, debido a su bajo error de predicción, una técnica robusta para predecir la variabilidad en los rendimientos como respuesta a variaciones ambientales. El estudio resalta la necesidad de contemplar la multicolinealidad al trabajar con covariables ambientales y modelos clásicosFil: Rosales Heredia, María Soleana de Las Mercedes. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Departamento de Desarrollo Rural. Area de Estadística y Biometría; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Bruno, Cecilia Ines. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Departamento de Desarrollo Rural. Area de Estadística y Biometría; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Departamento de Desarrollo Rural. Area de Estadística y Biometría; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentin

    Estrategias estadístico-computacionales avanzadas para análisis de expresión de proteínas/genes en cáncer. Advanced statistical and computational strategies for protein/gene expression analysis in cancer.

    No full text
    El objetivo de este proyecto, enmarcado en el área de metodología de análisis en bioingeniería-biotecnología aplicadas al estudio del cancer, es el análisis y caracterización a través modelos estadísticos con efectos mixtos y técnicas de aprendizaje automático, de perfiles de expresión de proteínas y genes de las vías metabolicas asociadas a progresión tumoral. Dicho estudio se llevará a cabo mediante la utilización de tecnologías de alto rendimiento. Las mismas permiten evaluar miles de genes/proteínas en forma simultánea, generando así una gran cantidad de datos de expresión. Se hipotetiza que para un análisis e interpretación de la información subyacente, caracterizada por su abundancia y complejidad, podría realizarse mediante técnicas estadístico-computacionales eficientes en el contexto de modelos mixtos y técnias de aprendizaje automático. Para que el análisis sea efectivo es necesario contemplar los efectos ocasionados por los diferentes factores experimentales ajenos al fenómeno biológico bajo estudio. Estos efectos pueden enmascarar la información subycente y así perder informacion relavante en el contexto de progresión tumoral. La identificación de estos efectos permitirá obtener, eficientemente, los perfiles de expresión molecular que podrían permitir el desarrollo de métodos de diagnóstico basados en ellos. Con este trabajo se espera poner a disposición de investigadores de nuestro medio, herramientas y procedimientos de análisis que maximicen la eficiencia en el uso de los recursos asignados a la masiva captura de datos genómicos/proteómicos que permitan extraer información biológica relevante pertinente al análisis, clasificación o predicción de cáncer, el diseño de tratamientos y terapias específicos y el mejoramiento de los métodos de detección como así tambien aportar al entendimieto de la progresión tumoral mediante análisis computacional intensivo

    Estrategias estadístico-computacionales avanzadas para análisis de expresión de proteínas/genes en cáncer. Advanced statistical and computational strategies for protein/gene expression analysis in cancer.

    No full text
    El objetivo de este proyecto, enmarcado en el área de metodología de análisis en bioingeniería-biotecnología aplicadas al estudio del cancer, es el análisis y caracterización a través modelos estadísticos con efectos mixtos y técnicas de aprendizaje automático, de perfiles de expresión de proteínas y genes de las vías metabolicas asociadas a progresión tumoral. Dicho estudio se llevará a cabo mediante la utilización de tecnologías de alto rendimiento. Las mismas permiten evaluar miles de genes/proteínas en forma simultánea, generando así una gran cantidad de datos de expresión. Se hipotetiza que para un análisis e interpretación de la información subyacente, caracterizada por su abundancia y complejidad, podría realizarse mediante técnicas estadístico-computacionales eficientes en el contexto de modelos mixtos y técnias de aprendizaje automático. Para que el análisis sea efectivo es necesario contemplar los efectos ocasionados por los diferentes factores experimentales ajenos al fenómeno biológico bajo estudio. Estos efectos pueden enmascarar la información subycente y así perder informacion relavante en el contexto de progresión tumoral. La identificación de estos efectos permitirá obtener, eficientemente, los perfiles de expresión molecular que podrían permitir el desarrollo de métodos de diagnóstico basados en ellos. Con este trabajo se espera poner a disposición de investigadores de nuestro medio, herramientas y procedimientos de análisis que maximicen la eficiencia en el uso de los recursos asignados a la masiva captura de datos genómicos/proteómicos que permitan extraer información biológica relevante pertinente al análisis, clasificación o predicción de cáncer, el diseño de tratamientos y terapias específicos y el mejoramiento de los métodos de detección como así tambien aportar al entendimieto de la progresión tumoral mediante análisis computacional intensivo

    DESARROLLO DE APLICACIONES ESTADÍSTICAS PARA LA AGRICULTURA DE PRECISIÓN. STATISTICAL APPLICATIONS FOR PRECISION AGRICULTURE

    No full text
    A partir de las últimas décadas se ha impulsado el desarrollo y la utilización de los Sistemas de Información Geográficos (SIG) y los Sistemas de Posicionamiento Satelital (GPS) orientados a mejorar la eficiencia productiva de distintos sistemas de cultivos extensivos en términos agronómicos, económicos y ambientales. Estas nuevas tecnologías permiten medir variabilidad espacial de propiedades del sitio como conductividad eléctrica aparente y otros atributos del terreno así como el efecto de las mismas sobre la distribución espacial de los rendimientos. Luego, es posible aplicar el manejo sitio-específico en los lotes para mejorar la eficiencia en el uso de los insumos agroquímicos, la protección del medio ambiente y la sustentabilidad de la vida rural. En la actualidad, existe una oferta amplia de recursos tecnológicos propios de la agricultura de precisión para capturar variación espacial a través de los sitios dentro del terreno. El óptimo uso del gran volumen de datos derivado de maquinarias de agricultura de precisión depende fuertemente de las capacidades para explorar la información relativa a las complejas interacciones que subyacen los resultados productivos. La covariación espacial de las propiedades del sitio y el rendimiento de los cultivos ha sido estudiada a través de modelos geoestadísticos clásicos que se basan en la teoría de variables regionalizadas. Nuevos desarrollos de modelos estadísticos contemporáneos, entre los que se destacan los modelos lineales mixtos, constituyen herramientas prometedoras para el tratamiento de datos correlacionados espacialmente. Más aún, debido a la naturaleza multivariada de las múltiples variables registradas en cada sitio, las técnicas de análisis multivariado podrían aportar valiosa información para la visualización y explotación de datos georreferenciados. La comprensión de las bases agronómicas de las complejas interacciones que se producen a la escala de lotes en producción, es hoy posible con el uso de éstas nuevas tecnologías. Los objetivos del presente proyecto son: (l) desarrollar estrategias metodológicas basadas en la complementación de técnicas de análisis multivariados y geoestadísticas, para la clasificación de sitios intralotes y el estudio de interdependencias entre variables de sitio y rendimiento; (ll) proponer modelos mixtos alternativos, basados en funciones de correlación espacial de los términos de error que permitan explorar patrones de correlación espacial de los rendimientos intralotes y las propiedades del suelo en los sitios delimitados. From the last decades the use and development of Geographical Information Systems (GIS) and Satellite Positioning Systems (GPS) is highly promoted in cropping systems. Such technologies allow measuring spatial variability of site properties including electrical conductivity and others soil features as well as their impact on the spatial variability of yields. Therefore, site-specific management could be applied to improve the efficiency in the use of agrochemicals, the environmental protection, and the sustainability of the rural life. Currently, there is a wide offer of technological resources to capture spatial variation across sites within field. However, the optimum use of data coming from the precision agriculture machineries strongly depends on the capabilities to explore the information about the complex interactions underlying the productive outputs. The covariation between spatial soil properties and yields from georeferenced data has been treated in a graphical manner or with standard geostatistical approaches. New statistical modeling capabilities from the Mixed Linear Model framework are promising to deal with correlated data such those produced by the precision agriculture. Moreover, rescuing the multivariate nature of the multiple data collected at each site, several multivariate statistical approaches could be crucial tools for data analysis with georeferenced data. Understanding the basis of complex interactions at the scale of production field is now within reach the use of these new techniques. Our main objectives are: (1) to develop new statistical strategies, based on the complementarities of geostatistics and multivariate methods, useful to classify sites within field grown with grain crops and analyze the interrelationships of several soil and yield variables, (2) to propose mixed linear models to predict yield according spatial soil variability and to build contour maps to promote a more sustainable agriculture

    Desarrollos estadísticos para el procesamiento de información genómica masiva en agro-biotecnología. Statistical developments for processing massive genomic information in agro-biotechnology.

    No full text
    Nuevas biotecnologías, como los marcadores de la molécula de ADN, permiten caracterizar el genoma vegetal. El uso de la información genómica producida para cientos o miles de posiciones cromosómicas permite identificar genotipos superiores en menos tiempo que el requerido por la selección fenotípica tradicional. La mayoría de los caracteres de las especies vegetales cultivadas de importancia agronómica y económica, son controlados por poli-genes causantes de un fenotipo con variación continua, altamente afectados por el ambiente. Su herencia es compleja ya que resulta de la interacción entre genes, del mismo o distinto cromosoma, y de la interacción del genotipo con el ambiente, dificultando la selección. Estas biotecnologías producen bases de datos con gran cantidad de información y estructuras complejas de correlación que requieren de métodos y modelos biométricos específicos para su procesamiento. Los modelos estadísticos focalizados en explicar el fenotipo a partir de información genómica masiva requieren la estimación de un gran número de parámetros. No existen métodos, dentro de la estadística paramétrica capaces de abordar este problema eficientemente. Además los modelos deben contemplar no-aditividades (interacciones) entre efectos génicos y de éstos con el ambiente que son también dificiles de manejar desde la concepción paramétrica. Se hipotetiza que el análisis de la asociación entre caracteres fenotípicos y genotipos moleculares, caracterizados por abundante información genómica, podría realizarse eficientemente en el contexto de los modelos mixtos semiparamétricos y/o de métodos no-paramétricos basados en técnicas de aprendizaje automático. El objetivo de este proyecto es desarrollar nuevos métodos para análisis de datos que permitan el uso eficiente de información genómica masiva en evaluaciones genéticas de interés agro-biotecnológico. Los objetivos específicos incluyen la comparación, respecto a propiedades estadísticas y computacionales, de estrategias analíticas paramétricas con estrategias semiparamétricas y no-paramétricas. Se trabajará con aproximaciones por regresión del análisis de loci de caracteres cuantitativos bajo distintas estrategias y escenarios (reales y simulados) con distinto volúmenes de datos de marcadores moleculares. En el área paramétrica se pondrá especial énfasis en modelos mixtos, mientras que en el área no paramétrica se evaluarán algoritmos de redes neuronales, máquinas de soporte vectorial, filtros multivariados, suavizados del tipo LOESS y métodos basados en núcleos de reciente aparición. La propuesta semiparamétrica se basará en una estrategia de análisis en dos etapas orientadas a: 1) reducir la dimensionalidad de los datos genómicos y 2) modelar el fenotipo introduciendo sólo las señales moleculares más significativas. Con este trabajo se espera poner a disposición de investigadores de nuestro medio, nuevas herramientas y procedimientos de análisis que permitan maximizar la eficiencia en el uso de los recursos asignados a la masiva captura de datos genómicos y su aplicación en desarrollos agro-biotecnológicos
    corecore