127 research outputs found
Genetic distances between molecular profiles obtained from multilocus-multiallele markers
Para expresar la magnitud de la identidad
genética (similaridad) o su complemento
(distancia) entre dos individuos caracterizados
molecularmente a través de marcadores del
tipo microsatélites (SSR), que son multilocusmultialélicos,
es necesario elegir una métrica
acorde con la naturaleza multivariada de los
datos. Comúnmente, las métricas de distancias
genéticas son diseñadas para expresar,
en un único número, la diferencia genética
entre dos poblaciones y son expresadas como
función de la frecuencia alélica poblacional.
Dichas métricas pueden también ser utilizadas
para calcular la distancia entre perfiles individuales,
pero las frecuencias alélicas no son
continuas en este caso. Alternativamente, se
pueden usar distancias geométricas obtenidas
como el complemento del índice de similaridad
para datos binarios que indican la presencia/
ausencia de cada alelo en un individuo. El
objetivo de este trabajo fue evaluar simultáneamente
el desempeño de ambos tipos de
métricas para ordenar y clasificar individuos en
una base de datos generadas a partir de loci
de marcadores microsatélites SSR. Se calcularon
11 métricas de distancias a partir de 17
loci SSR obtenidos desde 17 introducciones
de un banco de germoplasma de soja [Glycine
max (L.) Merr.]. Se evaluó el consenso de
los resultados obtenidos para la clasificación
de los 17 perfiles moleculares desde varias
métricas. Los resultados sugieren que los
diferentes tipos de métricas producen información
similar para comparar individuos. No
obstante, se realizó una clasificación de las
métricas que responden a diferencias entre
los núcleos de las expresiones de cálculo.In order to express the magnitude of the
genetic identity (similarity) or its complement
(distance) between individuals genotyped with
microsatellites (SSR), which are multilocusmultiallele
markers, is necessary to choose
a metric in agreement with the multivariate
nature of the marker data. Most of the metrics
of genetic distances were designed to express,
as a single quantity, the genetic difference between
two populations and they are expressed
as function of population allele frequencies.
Such metrics can also be used to calculate
distances between individual profiles, but the
allele frequencies are not longer continuous.
On the other hand, geometric distances obtained
as complement of similarity indexes for
binary data indicating allele presence/absence
in each individual, are commonly used for
pairwise individual comparisons. However,
they do not take into account the nested
allele within locus structure of SSR data. The
objective of this work was to simultaneously
evaluate the performance of both metric types
to order and classify individuals in a multivariate
basis generated by the use of SSR loci.
We applied 11 different distance metrics to a
dataset involving 17 SSR loci obtained from
17 entries of a soya [Glycine max (L.) Merr.]
germoplasm, and evaluated the consensus in
the results obtained from the classification of
the 17 molecular profiles from severl metrics.
The results suggest that most of the evaluated
metrics yield similar information about marker
profiles in the context of pairwise individual
comparisons. We provide a kernel-based
metric classification.Fil: Bruno, Cecilia.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría.Fil: Balzarini, Mónica.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría
Ordinations of genetic data from multidimensional markers
Nuevas biotecnologías permiten obtener
información para caracterizar materiales
genéticos a partir de múltiples marcadores,
ya sean éstos moleculares y/o morfológicos.
La ordenación del material genético a través
de la exploración de patrones de variabilidad
multidimensionales se aborda mediante
diversas técnicas de análisis multivariado.
Las técnicas multivariadas de reducción de
dimensión (TRD) y la representación gráfica
de las mismas cobran sustancial importancia
en la visualización de datos multivariados en
espacios de baja dimensión ya que facilitan
la interpretación de interrelaciones entre las
variables (marcadores) y entre los casos u
observaciones bajo análisis. Tanto el Análisis
de Componentes Principales, como el Análisis
de Coordenadas Principales y el Análisis de
Procrustes Generalizado son TRD aplicables
a datos provenientes de marcadores moleculares
y/o morfológicos. Los Árboles de Mínimo
Recorrido y los biplots constituyen técnicas
para lograr representaciones geométricas
de resultados provenientes de TRD. En este
trabajo se describen estas técnicas multivariadas
y se ilustran sus aplicaciones sobre
dos conjuntos de datos, moleculares y morfológicos,
usados para caracterizar material
genético fúngico.New biotechnologies allow to obtain information
for genetic characterization from multiple
molecular and/or morphological markers.
The ordination of genetic material through the
exploration of variability patterns is addressed
by multivariate methods. Dimension reduction
techniques (DRT) and graphic representation
are crucial to visualize multivariate data in lowdimensional
spaces since it facilitate the understanding
of relationships among individuals
and/or markers. The principal component
analysis, the multidimensional scaling and
generalized procrustes analysis are dimension
reduction techniques applicable to data from
molecular and/or morphological markers.
The minimum spanning trees and the biplots
are techniques that allow geometrical representations
of results from DRT. This paper
describes such techniques and its applications
are illustrated on a dataset with molecular and
morphological markers characterizing fungus
genetic material.Fil: Bruno, Cecilia.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría.Fil: Balzarini, Mónica.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría
Cuantificando diversidad genética : una revisión de métodos estadísticos multivariados para estudiar variabilidad a nivel de genes
Measures of agro-ecosystems genetic variability are essential to sustain scientific-based
actions and policies tending to protect the ecosystem services they provide. To build the genetic
variability datum it is necessary to deal with a large number and different types of variables.
Molecular marker data is highly dimensional by nature, and frequently additional types of
information are obtained, as morphological and physiological traits. This way, genetic variability
studies are usually associated with the measurement of several traits on each entity. Multivariate
methods are aimed at finding proximities between entities characterized by multiple traits by
summarizing information in few synthetic variables.
In this work we discuss and illustrate several multivariate methods used for different
purposes to build the datum of genetic variability. We include methods applied in studies for
exploring the spatial structure of genetic variability and the association of genetic data to
other sources of information. Multivariate techniques allow the pursuit of the genetic variability
datum, as a unifying notion that merges concepts of type, abundance and distribution of
variability at gene level.Obtener estimaciones confiables de la diversidad genética en los agroecosistemas es
esencial para tomar decisiones basadas en el conocimiento científico que permitan proteger
los servicios ecosistémicos que éstos brindan. Para construir el dato de variabilidad genética
es necesario trabajar con gran cantidad de variables de distinta naturaleza. Los marcadores
moleculares proveen datos multidimensionales que generalmente son complementados con
otros tipos de información, por ejemplo datos morfológicos o fisiológicos. Así, los estudios sobre
variabilidad genética están frecuentemente asociados a la medición de muchos caracteres en
una misma entidad biológica. De especial interés son los métodos multivariados diseñados
para analizar similitudes entre entidades caracterizadas por múltiples variables que permiten
resumir la información en pocas variables sintéticas informativas de la variabilidad total.
En este trabajo se discuten e ilustran distintos métodos multivariados utilizados en la
construcción del dato de variabilidad genética. Se incluyen métodos aplicados a la exploración
de la estructura espacial de la variabilidad genética y métodos para estudiar la asociación
de los datos genéticos con otras fuentes de información. Las técnicas multivariadas en
esta revisión permiten abordar el problema de construir al dato de variabilidad genética
como un concepto donde convergen mediciones sobre tipo, abundancia y distribución de
la variabilidad a nivel de genes.Fil: Balzarini, Mónica.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría.Fil: Teich, Ingrid.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Centro de Relevamiento y Evaluación de Recursos Agrícolas y Naturales.Fil: Bruno, Cecilia.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría.Fil: Peña, Andrea.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría
Mapeo de materia orgánica del suelo a escala de campo
La información sobre la distribución de la materia orgánica (MO) a escala fina es clave no solo para el manejo de la fertilidad del suelo sino también para estimar la reserva de carbono orgánico del suelo. En este trabajo se comparan dos métodos para mapear la variabilidad de MO a escala de campo: el algoritmo de aprendizaje automático quantile regression forest (QRF) y la regresión bayesiana, estimada por INLA. Ambos métodos se aplican para estimar la relación entre MO y variables de sitio, de fácil obtención, que es usada para predecir MO en sitios no muestreados. Se emplearon 279 puntos georreferenciados de MO muestreados en tres periodos (2005, 2008 y 2011) en una superficie de 2.240 ha bajo agricultura. Para el ajuste de los modelos de regresión se utilizaron variables topográficas e índices de vegetación como variables explicativas. Los resultados sugieren que la regresión bayesiana para datos con correlación espacio-temporal supera a QRF en términos de error de predicción y mapeo de la variabilidad al menos para el tipo de condiciones topográficas y de suelos del estudio. La posibilidad de mapear la evolución del contenido de MO del suelo a esta escala representa un avance para el monitoreo de la sustentabilidad. Los mapas de variabilidad espacial de la MO a escala de campo pueden ser usados para monitorear el efecto de diferentes prácticas de manejo de suelos o como alertas de medidas de manejo que incrementen la entrada de carbono al sistema.Sociedad Argentina de Informática e Investigación Operativ
Principal component analysis with georeferenced data : an application in precision agriculture
La utilización de nuevas tecnologías
asociadas a la agricultura de precisión permite
capturar información de múltiples variables
en gran cantidad de sitios georreferenciados
dentro de lotes en producción. Las covariaciones
espaciales de las propiedades
del suelo y el rendimiento del cultivo
pueden evaluarse a través del análisis de
componentes principales clásico (PCA). No
obstante, como otros métodos multivariados
descriptivos, el PCA no ha sido desarrollado
explícitamente para datos espaciales.
Nuevas versiones de análisis multivariado
permiten contemplar la autocorrelación
espacial entre datos de sitios vecinos. En este
trabajo se aplican y comparan los resultados
de dos técnicas multivariadas, el PCA y
MULTISPATI-PCA. Este último incorpora la
información espacial a través del cálculo del
índice de Moran entre los datos de un sitio y el
dato promedio de sus vecinos. Los resultados
mostraron que utilizando MULTISPATI-PCA
se detectaron correlaciones entre variables
que no fueron detectadas con el PCA. Los
mapas de variabilidad espacial construidos
a partir de la primera componente de
ambas técnicas fueron similares; no así
los de la segunda componente debido a
cambios en la estructura de co-variación
identificada, al corregir la variabilidad por
la autocorrelación espacial de los datos. El
método MULTISPATI-PCA constituye una
herramienta importante para el mapeo de
la variabilidad espacial y la identificación de
zonas homogéneas dentro de lotes.New precision agriculture technologies allow
collecting information from several variables at
many georeferenced locations within crop fields.
The spatial covariation of soil properties and crop
yield data can be evaluated by principal component
analysis (PCA). Nevertheless, PCA has not been
explicitly developed for spatial data as other
multivariate descriptive methods. Other multivariate
techniques that include spatial autocorrelation
among data of neighborhood sites have been
recently developed. In this paper, we apply and
compare two multivariate analyses, PCA and
spatially constrained multivariate analysis methods
(MULTISPATI-PCA). The latter incorporates
the spatial information into multivariate analysis
calculating Moran’s index between the data at one
location and the mean values of its neighbors. The
results showed that MULTISPATI-PCA detected
relations in the data that were not detected with
PCA. The mapping of spatial variability from the
first principal component was similar between PCA
and MULTISPATI-PCA, but maps from the second
component were different due to the variance
correction by spatial autocorrelation. MULTISPATIPCA
method represents a crucial tool to map spatial
variability within a field, and to identify homogeneous
zones in a multivariate sense.Fil: Córdoba, Mariano.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría.Fil: Balzarini, Mónica.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría.Fil: Bruno, Cecilia.
Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría.Fil: Costa, José Luis.
Instituto Nacional de Tecnología Agropecuaria (Argentina). Estación Experimental Agropecuaria Balcarc
Evaluación de la tolerancia al frío en genotipos de arroz templado (Oryza sativa L. ssp. japonica) en estado de plántula
Cold is the most important abiotic factor that affect rice yield in Chile, which can alter the phenology and physiology of the rice at seedling stage. With the aim to increase the accuracy for cold tolerance evaluation in Chilean Rice Breeding Program of the Instituto de Investigaciones Agropecuarias (INIA), 109 experimental lines were evaluated to cold tolerance using morphological and physiological traits, at seedling stage. Cold treatment was achieved by placing seedlings at 5 °C on dark for 72 h and evaluations were made after seven days recovery. Leaf chlorosis based on the standard evaluation system scale (SES), Chlorophyll content (Chl), Malondialdehyde concentration (MDA) and maximum quantum yield of Photosystem II (Fv/Fm) were evaluated. Best linearunbiased prediction (BLUP) for all traits and multivariate analysis were made in order to determine the cold tolerant genotypes.Variability in cold tolerance among experimental lines was described by principal component and cluster analysis of BLUPs for all traits. The broad sense heritability calculated for SES scale was the highest (0.54), while for Fv/Fm was the lowest (0.10). Genotypes with high cold tolerance were Quila 242002 and Quila 241304, while more susceptible genotypes were Quila 64117, Quila 260312 and Quila 241607. The results suggest that the BLUPs and multivariate analysis allow adequate clustering of rice genotypes according to the degree of their cold tolerance. Finally, we suggest that SES scale and Chl content were the most suitable traits to evaluate cold tolerance for the rice genotypes studied and for the conditions evaluated.El frío es el factor abiótico más importante que afecta los rendimientos del arroz en Chile, el cual puede alterar la fenología y la fisiologíadel arroz en estado de plántula. Con el objetivo de incrementar la precisión en la evaluación por tolerancia al frío en el Programa deMejoramiento Genético de arroz del Instituto de Investigaciones Agropecuarias (INIA) de Chile, se evaluó la tolerancia al frío de 109 líneasexperimentales en estado de plántula, utilizando atributos morfológicos y fisiológicos. El tratamiento por frío fue realizado sometiendolas plántulas a 5 °C por 72 h y las evaluaciones fueron realizadas después de siete días de recuperación. Se evaluó la clorosis foliar segúnla escala del sistema de evaluación estándar del IRRI (SES), el contenido de clorofila (Chl), la concentración de malondialdehido (MDA)y la eficiencia máxima fotoquímica del fotosistema II (Fv/Fm). El mejor predictor lineal insesgado (BLUP) para todos los atributos y unanálisis multivariado fueron realizados con el fin de determinar los genotipos tolerantes al frío. La variabilidad de la tolerancia al frío entrelas líneas experimentales fue descrita mediante componentes principales y un análisis de conglomerado utilizando los BLUPs para cadaatributo. La heredabilidad en sentido amplio calculada para la escala SES fue la mayor (0,54), mientras que para Fv/Fm fue la menor (0,10).Quila 242002 y Quila 241304 fueron los genotipos con mayor tolerancia al frío, mientras que los genotipos con mayor susceptibilidadfueron Quila 64117, Quila 260312 y Quila 241607. Los resultados sugieren que los BLUPs y el análisis multivariado permiten un adecuadoagrupamiento de los genotipos según el grado de su tolerancia al frío. Finalmente, sugerimos que la escala SES y el contenido de Chl fueronlos atributos más adecuados para evaluar la tolerancia al frío en los genotipos de arroz estudiados en las condiciones evaluadas
Delimitación de zonas de manejo con modelos de elevación digital y profundidad de suelo
La variabilidad espacial del rendimiento de los cultivos esta relacionada con los atributos del terreno y la profundidad del suelo. El presente estudio tuvo como objetivo determinar la utilidad de los modelos de elevación digital (DEM) y profundidad de suelo para delimitar zonas de manejo homogéneas en lotes de producción. Se calcularon atributos del terreno extraídos del DEM (elevación, pendiente, curvatura plana y flujo de acumulación) y se analizó su relación espacial con el rendimiento de los cultivos y la profundidad del suelo en un lote de 47ha ubicado en el partido de Lobería, Provincia de Buenos Aires, Argentina. Las campañas agrícolas analizadas fueron 2007/08 (soja), 2009/10 (trigo) y 2010/11 (soja). Se evaluó mediante ANOVA la significancia de las diferencias entre las potenciales zonas de manejo. Los atributos del terreno y profundidad de suelo explicaron entre un 67 y 90% de la variación del rendimiento de los cultivos. Además, permitieron delimitar zonas de manejo significativamente diferentes (p≤0,05). Los resultados sugieren que los datos de DEM y de profundidad de suelo pueden explicar la variabilidad espacial del rendimiento y constituyen una herramienta para delimitar zonas de manejo para orientar el manejo sitio-específico.Fil: Peralta, Nahuel Raúl. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina; Instituto Nacional de Tecnología Agropecuaria. Centro Regional Buenos Aires. Estación Experimental Agropecuaria Balcarce; Argentina;Fil: Costa, Jose Luis. Instituto Nacional de Tecnologia Agropecuaria; Argentina; Instituto Nacional de Tecnología Agropecuaria. Centro Regional Buenos Aires. Estación Experimental Agropecuaria Balcarce; Argentina;Fil: Castro Franco, Mauricio. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina; Instituto Nacional de Tecnología Agropecuaria. Centro Regional Buenos Aires. Estación Experimental Agropecuaria Balcarce; Argentina;Fil: Balzarini Mónica. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Two step procedure to model site specific herbicide soil persistence
Ponencia presentada en 30th International Biometric Conference (IBC 2020). Modalidad Virtual, 6 de Julio al 30 de Agosto 2020.Soil herbicide persistence is the length of time the herbicide molecule remains active in soil and it is crucial to describe risks of diffuse contamination in agriculture. Persistence is characterized by ?half-life?, which is the time it takes to reach half of the initial concentration supplied to soil. Half-life is estimated as a function of the dissipation curve parameters. Analytic quantification is costly for obtaining dissipation curves at many sites. Methodological tools to predict half-life in a continuous spatial domain, from a sample of dissipation curves, become crucial in regional studies. Since herbicide persistence in the environment depends on sites variables, model-based predictions of half-life as function of environmental features, are pursuit. The objective of this work was to design a statistical workflow for digital modeling of soil herbicide persistence at regional scale. From a regional soil survey, a sample of sites was drawn using the cLHS method. Samples were fortified with the herbicide atrazine and incubated for 21 days. Herbicide concentrations were measured at days 0,3,7,14 and 21 on each soil by liquid chromatography coupled to tandem mass spectrometry (LC-MS / MS) using QuEChERs. A two-step procedure was proposed for digital mapping of herbicide persistence in the environment. First, an exponential model with a random site effect, associated to the decay rate, was fitted to derive atrazine half-life for each sampled soil. Second, a Bayesian regression with a site random effect relating the resulting half-life values with soil and land-use values was adjusted to predict the spatial distribution of atrazine persistence at un-sampled sites for mapping. The addition of a random effect on the decay rate produced a better fit than a fixed exponential model and allowed us to explore half-life variability among soils. Atrazine persistence was mainly explained by the agricultural use of land (sites with previous grass crops had higher decay rates than other land-uses). The two-step procedure made possible to accurate map the spatial variability of atrazine persistence in soil and enhanced its environmental understanding.Fil: Giannini Kurina, Franca. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.Fil: Giannini Kurina, Franca. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Unidad de Fitopatología y Modelización Agrícola (UFYMA); Argentina.Fil: Giannini Kurina, Franca. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola (UFYMA); Argentina.Fil: Hang, Susana Beatriz. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.Fil: Balzarini, Mónica Graciela. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Unidad de Fitopatología y Modelización Agrícola (UFYMA); Argentina.Fil: Balzarini, Mónica Graciela. Instituto Nacional de Tecnología Agropecuaria (INTA). Unidad de Fitopatología y Modelización Agrícola (UFYMA); Argentina.Fil: Borello, Julieta. Gobierno de la Provincia de Córdoba. Ministerio de Ciencia y Tecnología (MINCyT). Centro de Excelencia en Productos y Procesos (CEPROCOR); Argentina
Algoritmo para el análisis de la variabilidad temporal y espacial de suelos agrícolas a escala de lote
El análisis de datos georreferenciados en lotes agrícolas sirve para comprender la variabilidad espacial del suelo y realizar zonificaciones para agricultura sitio-especifica. La variabilidad de estos datos a través del tiempo es menos analizada. En este trabajo se propone una metodología estadística para estimar tendencia temporal de variables edáficas y construir mapas de variabilidad espacio-temporal. El algoritmo se basa en el análisis de la tendencia interanual promedio de sitios, estimación de la varianza temporal por sitio para cada variable y delimitación de zonas homogéneas. Para ilustrar su aplicación, se analizó la tendencia interanual promedio y la variabilidad temporal de MO, P, pH y CE en 12 lotes de la región semiárida, abarcado una superficie de 2.240 ha bajo agricultura intensiva. Los resultados mostraron que la variación espacial en las características de suelo no es permanente, produciéndose significativos cambios en la delimitación de zonas homogéneas.Sociedad Argentina de Informática e Investigación Operativ
Evaluación de algoritmos de clasificación supervisada en plataformas web de la nube (Google Earth Engine) aplicado al mapeo de coberturas forrajeras
El objetivo de este trabajo fue experimentar el uso d dos algoritmos y evaluar su desempeño como herramientas para clasificar coberturas de vegetación, particularmente forrajeras, en el valle de Traslasierra, de la provincia de Córdoba, Argentina.
SVM y RF, fueron seleccionados entre los algoritmos de clasificación disponibles en la interfaz de la aplicación de programación del Google Earth Engine (GEE).Sociedad Argentina de Informática e Investigación Operativa (SADIO
- …