Um coeficiente de correlação cofenética para o método de Tocher

Abstract

The objective of this work was to propose a way of using the Tocher’s method of clustering to obtain a matrix similar to the cophenetic one obtained for hierarchical methods, which would allow the calculation of a cophenetic correlation. To illustrate the obtention of the proposed cophenetic matrix, we used two dissimilarity matrices – one obtained with the generalized quadratic Mahalanobis distance and the other with the Euclidean distance – between 17 garlic cultivars, based on six morphological characters. Basically, the proposal for obtaining the cophenetic matrix was to use the average distances within and between clusters, after performing the clustering. A function in R language was proposed to compute the cophenetic matrix for Tocher’s method. The empirical distribution of this correlation coefficient was briefly studied. For both dissimilarity measures, the values of cophenetic correlation obtained for the Tocher’s method were higher than those obtained with the hierarchical methods (Ward’s algorithm and average linkage – UPGMA). Comparisons between the clustering made with the agglomerative hierarchical methods and with the Tocher’s method can be performed using a criterion in common: the correlation between matrices of original and cophenetic distances.O objetivo deste trabalho foi propor uma forma de uso do método de Tocher para obtenção de uma matriz análoga à matriz cofenética obtida para métodos hierárquicos, o que permitiria o cálculo de uma correlação cofenética. Para ilustrar a obtenção da matriz cofenética proposta, foram utilizadas duas matrizes de dissimilaridade – uma obtida com a distância quadrada generalizada de Mahalanobis e outra com a distância euclidiana – entre dezessete cultivares de alho, com base em seis caracteres morfológicos. Basicamente, a proposta para obtenção da matriz cofenética foi a de usar, após a realização do agrupamento, as distâncias médias intra e intergrupos. Uma função em linguagem R foi proposta para computar a matriz cofenética para o método de Tocher. A distribuição empírica desse coeficiente de correlação foi estudada de forma sucinta. Para as duas medidas de dissimilaridade, os valores do coeficiente de correlação cofenética obtidos para o método de Tocher foram superiores aos obtidos com os métodos hierárquicos (algoritmo de Ward e ligação média – UPGMA). Comparações entre agrupamentos feitos com os métodos hierárquicos aglomerativos e com o método de Tocher podem ser realizadas com o uso de um critério em comum: o da correlação entre matrizes de distâncias cofenéticas e originais

    Similar works