Estabilidade de Classificadores de Decisão em Árvore Binária para Dados Imagem em Alta Dimensão

Abstract

This paper deals with the problem of classifying high-dimensional image data image data using a multiple stage classifier structured as a binary tree. The aim here consists in finding the optimal structure for the binary tree in the sense of achieving a stable accuracy. The advantage presented by a multiple stage classifier lies on the fact that only a sub-set of classes is considered at each stage, allowing a better selection of the features to be used at each node.  The binary tree is a particular case of a tree structured classifier, on which only two classes are considered at each node. This peculiarity makes possible the direct use of statistical distances for feature reduction (selection or extraction). In this study the criterion used for feature reduction at each node consists in optimizing the Bhattacharyya distance separating both classes in the node. The optimization of Bhattacharyya distance was based on the covariance matrices. Once the final set of features is obtained at each particular node, the classification is performed using the Gaussian Maximum Likelihood decision rule. Tests were performed using high-dimensional image data collected by the sensor system AVIRIS covering a test area. The criteria to evaluate the performance of the classifiers are: the final accuracy yielded by the classifier, its stability, and the required computer time.Neste trabalho é investigada uma abordagem para classificação de dados imagem em alta dimensão utilizando classificadores de decisão em árvore binária. O objetivo é selecionar uma estrutura binária que forneça a maior estabilidade possível em relação à acurácia média de classificação para dados imagem em alta dimensão. A utilização de um classificador hierárquico em estrutura binária, analisando pares de classes em múltiplas etapas ao invés do conjunto total de classes em uma única etapa, permite extrair variáveis mais adequadas para cada subconjunto particular de classes. Contudo, devido às múltiplas estruturas binárias que podem ser produzidas, a seleção de uma árvore binária que seja ótima no sentido de produzir resultados estáveis é uma tarefa complexa. Considerando somente duas classes em cada etapa do processo, é possível implementar a distância de Bhattacharyya para fins de estimação da separabilidade entre classes e também como critério para redução de dimensões. O critério de decisão utilizado no processo de classificação é o da Máxima Verossimilhança Gaussiana (MVG). Experimentos foram realizados utilizando dados imagem coletados pelo sensor AVIRIS, investigando o comportamento da acurácia da imagem temática produzida em função de diferentes valores para o limiar de classificação e para o número de variáveis utilizadas. A performance da metodologia proposta é avaliada segundo a complexidade da árvore de classificação, o tempo de processamento, a acurácia média final da imagem temática produzida e a estabilidade do classificador

    Similar works