24 research outputs found
El Llegat de Galton, Pearson, Fréchet i d'altres: com mesurar i interpretar l'associació estadÃstica
Presentem en tres parts els conceptes de correlació i d'associació estadÃstica, començant per la noció de correlació de Galton, millorada per Pearson. Utilitzem com a il.lustració les dades clà ssiques de Galton i Pearson sobre heretabilitat de pares i fills respecte a l'estatura. La segona part explica com s'han d'estudiar les mateixes dades des d'una perspectiva multivariant (anà lisi de correlació canònica i de correspondències).
Utilitzem també dades de Fisher. Mostrem com podem associar dades de tipus general mitjançant distà ncies. La tercera part la dediquem a les distribucions bivariants. Presentem la teoria de funcions i valors propis per a dos nuclis, que s'aplica al desenvolupament diagonal d'una distribució bivariant, incloent-hi els desenvolupaments continus en termes d'integrals. Proposem una famÃlia de còpules canòniques, que permet generar distribucions bivariants.Along three parts, we present the concepts of correlation and statistical association, starting with GaltonÂ’s notion of correlation, improved by Pearson. As an illustration, we use the classic data of Galton and Pearson on heritability of parents and children regarding the stature. The second part explains how to study the same data from a multivariate perspective (canonical correlation analysis, correspondence analysis). We also use data from Fisher. We show how to associate general data sets with distances. The third part is devoted to the bivariate distributions. We present the theory of eigenfunctions and eigenvalues for two kernels, which is applied to the diagonal expansion of a bivariate distribution, including continuous expansions in terms of integrals. We propose a family of canonical copulas, which can generate bivariate distributions
Another generalization of the bivariate FGM distribution with two-dimensional extensions
The Farlie–Gumbel–Morgenstern family of bivariate distributions with given marginals is frequently used in theory and applications and has been generalized in many ways. With the help of two auxiliary distributions, we propose another generalization and study its properties. After defining the dimension of a distribution as the cardinal of the set of canonical correlations, we prove that some well-known distributions are practically two-dimensional. Then we introduce an extended FGM family in two dimensions and study how to approximate any distribution to this family
A parametric approach to correspondence analysis
AbstractWe compare correspondence analysis (CA) and the alternative approach using Hellinger distance (HD), for representing categorical data in a contingency table. As both methods may be appropriate, we introduce a parameter and define a generalized version of correspondence analysis (GCA) which contains CA and HD as particular cases. Comparison with alternative approaches are performed. We propose a coefficient which globally measures the similarity between CA and GCA, which can be decomposed into several components, one component for each principal dimension, indicating the contribution of the dimensions on the difference between both representations. Two criteria for choosing the best value of the parameter are proposed
The canonical analysis applied to the taxonomy and evolution of the genus Timarcha Latr. (Coleoptera, Chrysomelidae)
Los resultados obtenidos mediante el Análisis Canónico en 32
muestras poblacionales pertenecientes a 24 taxones, que corresponden
a 14 grupos de Bechyné (1948), proporcionan pruebas acerca del
estado taxonómico y evolutivo en múltiples taxones de Timarcha. Los
datos biométricos se interpretan principalmente junto a los de la
sistemática morfológica y de la cariologÃa. En general, se ha demostrado
concordancia entre la biometrÃa y los otros aspectos, excepto
en algunos casos. Se detecta un acentuado parentesco biométrico
entre el conjunto de taxones relacionados con T. goettingensis. Este
conjunto comprende los antiguos grupos de Bechyné: T. goettingensis,
T. monticola, T. recticollis, T. fallax, T. geniculata y T. perezi.
Como todos estos taxones manifiestan una fuerte homogeneidad
genética y una variación gradual en los caracteres medidos, parece
claro que no pueden ser especies independientes. Esta situación se
explica adecuadamente considerando varias clinas interrelacionadas,
aunque algunos taxones aislados pueden mostrar posiblemente un
cierto grado de interesterilidad sexual.
Las restantes especies no incluidas en este conjunto se separan
con claridad pero a su vez derivan probablemente de él en varias
lÃneas filéticas. Este análisis biométrico demuestra también algunos
ejemplos de convergencia entre especies sin una homologÃa genética
estrecha
Eigenanalysis on a bivariate covariance kernel
Certain constructions of copulas can be interpreted as an eigendecomposition of a kernel. We study some properties of the eigenfunctions and their integrals of a covariance kernel related to a bivariate distribution. The covariance between functions of random variables in terms of the cumulative distribution function is used. Some bounds for the trace of the kernel and some inequalities for a continuous random variable concerning a function and its derivative are obtained. We also obtain relations to diagonal expansions and canonical correlation analysis and, as a by-product, series of constants for some particular distributions.primary 62H20 secondary 60E05 FGM family Eigenfunctions Hoeffding's lemma Inequalities for covariances Positive quadrant dependence Series of constants Canonical correlations
Karl Pearson, fundador de l’estadÃstica moderna
El matemà tic K. Pearson, pare de l’estadÃstica tal com l’entenem avui dia, va ser un cientÃfic i pensador bastant polifacètic. Tot i que treballava en matemà tica aplicada, mecà nica, elasticitat, teoria de l’evolució, i sovint escrivia sobre història i filosofia, el contacte amb biòlegs el va decantar cap a l’estadÃstica descriptiva i poc després cap a l’estadÃstica matemà tica, que ell mateix va fundar. Les seves aportacions a la correlació i regressió, la prova khi-quadrat, l’anà lisi de components principals, el coeficient de semblança racial, són de gran importà ncia. Per glossar la seva personalitat, es fa una exposició de les seves aportacions, relacionant-les amb altres descobriments de l’època. Es comenten també alguns aspectes polèmics (eugenèsia, controvèrsies amb Fisher i Neyman). Finalment es fa una breu exposició de la història del coeficient de correlació des de 1846 fins 2015