2,016 research outputs found

    Modulated Chaos as a Source of Images for Numbers

    Get PDF
    Classificação de imagens de Markus-Lyapounof

    Esquemas de transferência para aprendizado profundo em classificação de imagens

    Get PDF
    Orientadores: Eduardo Alves do Valle Junior, Sandra Eliza Fontes de AvilaDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: Em Visão Computacional, a tarefa de classificação é complexa, pois visa a detecção da presença de categorias em imagens, dependendo criticamente da habilidade de aprender modelos computacionais generalistas a partir de amostras de treinamento. Aprendizado Profundo (AP) para tarefas visuais geralmente envolve o aprendizado de todos os passos deste processo, da extração de características até a atribuição de rótulos. Este tipo pervasivo de aprendizado garante aos modelos de AP maior capacidade de generalização, mas também traz novos desafios: um modelo de AP deverá estimar um grande número de parâmetros, exigindo um imenso conjunto de dados anotados e grandes quantidades de recursos computacionais. Neste contexto, a Transferência de Aprendizado emerge como uma solução promissora, permitindo a reciclagem de parâmetros aprendidos por modelos diferentes. Motivados pela crescente quantidade de evidências para o potencial de tais técnicas, estudamos de maneira abrangente a transferência de conhecimento de arquiteturas profundas aplicada ao reconhecimento de imagens. Nossos experimentos foram desenvolvidos para explorar representações internas de uma arquitetura profunda, testando sua robustez, redundância e precisão, com aplicações nos problemas de rastreio automático de melanoma, reconhecimento de cenas (MIT Indoors) e detecção de objetos (Pascal VOC). Também levamos a transferência a extremos, introduzindo a Transferência de Aprendizado Completa, que preserva a maior parte do modelo original, mostrando que esquemas agressivos de transferência podem atingir resultados competitivosAbstract: In Computer Vision, the task of classification is complex, as it aims to identify the presence of high-level categories in images, depending critically upon learning general models from a set of training samples. Deep Learning (DL) for visual tasks usually involves seamlessly learning every step of this process, from feature extraction to label assignment. This pervasive learning improves DL generalization abilities, but brings its own challenges: a DL model will have a huge number of parameters to estimate, thus requiring large amounts of annotated data and computational resources. In this context, transfer learning emerges as a promising solution, allowing one to recycle parameters learned among different models. Motivated by the growing amount of evidence for the potential of such techniques, we study transfer learning for deep architectures applied to image recognition. Our experiments are designed to explore the internal representations of DL architectures, testing their robustness, redundancy and precision, with applications to the problems of automated melanoma screening, scene recognition (MIT Indoors) and object detection (Pascal VOC). We also take transfer learning to extremes, introducing Complete Transfer Learning, which preserves most of the original model, showing that aggressive transfer schemes can reach competitive resultsMestradoEngenharia de ComputaçãoMestre em Engenharia Elétric

    Classificação de áreas de café em Minas Gerais por meio do novo algoritmo QMAS em imagem espectral Geoeye-1.

    Get PDF
    Diante do grande desafio que é classificar imagens de sensoriamento remoto de café, o objetivo deste trabalho foi aplicar o novo algoritmo QMAS para classificar áreas de café comparando os resultados com o método tradicional de Classificação Supervisionada MAXVER, em imagens Geoeye-1. Os resultados indicam que o algoritmo QMAS obteve mais êxito na classificação das áreas de café do que o MAXVER, configurando-se em uma alternativa viável a classificação de imagens de satélite.SBSR 2011

    An evaluation of pre-trained models for feature extraction in image classification

    Get PDF
    In recent years, we have witnessed a considerable increase in performance in image clas sification tasks. This performance improvement is mainly due to the use of deep learning techniques. Generally, deep learning techniques demand a large set of annotated data, making it a challenge to apply this method when little data is available. In this scenario, transfer learning strategies have become a promising alternative to overcome these issues. This work aims to compare the performance of different pre-trained neural networks for feature extraction in image classification tasks. We evaluated 16 different pre-trained models in four datasets, including a dataset of Geological Images that are the focus of this work. Our results demonstrate that for the Geological Images dataset, the best model was CLIP-ViT-B followed by CLIP-ResNet50. Similarly, the best general performance along all four datasets was achieved by CLIP-ViT-B and ViT-H-14, where the CLIP-ResNet50 model had similar performance but with lesser variability. Therefore, our study provides evidence supporting the choice of models for transfer learning in image classification tasks involving the four target datasets.Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas

    USO DE ALGORITMOS GENÉTICOS COMO REDUTOR DE DIMENSIONALIDADE NA CLASSIFICAÇÃO DE IMAGENS HIPERESPECTRAIS

    Get PDF
    Orientador: Jorge A.Silva CentenoCo-orientadora: Selma R.A.RibeiroDissertaçăo (mestrado) - Universidade Federal do Paraná, Setor de Cięncias da Terra, Programa de Pós-Graduaçăo em Cięncias Geodésicas. Defesa: Curitiba, 2006Inclui bibliografiaResumo: A análise de imagens hiperespectrais possibilita um estudo mais detalhado sobre osobjetos na superfície da terra. Devido sua alta resoluçăo espectral, a tarefa deanálise desses dados defronta-se com o fenômeno de Hughes. Esse fenômenoocorre devido ao número geralmente limitado de amostras frente a alta dimensionalidade dos dados hiperespectrais. Uma das possíveis soluçőes para esseproblema é a reduçăo da dimensionalidade. Essa técnica de reduçăo de dimensăo édividida em duas abordagens: seleçăo de feiçőes e extraçăo de feiçőes. A propostadesse trabalho foi o uso dos Algoritmos Genéticos como redutores dedimensionalidade de dados hiperespectrais, para fins de classificaçăo. Foi realizadoum estudo comparativo entre os algoritmos propostos e os tradicionais algoritmosseqüenciais: Sequential Forward Selection (SFS) e Sequential Backward Selection(SBS). Esses dois últimos algoritmos săo conhecidos pela simplicidade tantoconceitual como computacional. Uma segunda comparaçăo foi realizada entrealgoritmos de seleçăo de feiçőes e um algoritmo do tipo extraçăo de feiçőes (Análisepor Componentes Principais). Nesse estudo foi analisado tanto a acurácia no processo de classificaçăo como o tempo de processamento demandado por essesalgoritmos. Após a reduçăo da dimensionalidade, uma classificaçăo foi executada. O classificador utilizado foi de máxima verossimilhança. Para julgamento da acuráciaforam utilizados os índices kappa, acurácia global e a acurácia do ponto de vista dousuário. A metodologia proposta mostrou-se promissora, pois apresentou resultados,em termos de acurácia, superiores aos gerados pelos demais algoritmos estudados

    Otimização de redes convolucionais para classificação de imagens

    Get PDF
    As redes convolucionais têm demonstrado eficácia na resolução de diversos tipos de problemas, nomeadamente classificação de imagens, reconhecimento ou localização de objetos, reconhecimento de som, entre outros. A elevada robustez destas redes permite a sua difusão em áreas de extrema importância para a sociedade, tal como a área biomédica, que inclui um vasto conjunto de tarefas de análise de imagens e diagnóstico clínico. Contudo, o sucesso destes modelos está dependente da identificação da estrutura e dos valores de outros hiperparâmetros, que melhor se ajustam à resolução de um problema específico, sendo que esta tarefa requer elevado esforço computacional e conhecimento pericial. De modo a reduzir estas dificuldades, este trabalho propõe uma metodologia de otimização autónoma dos hiperparâmetros de diferentes arquiteturas convolucionais. A metodologia baseia-se na utilização do algoritmo de inteligência coletiva, Particle Swarm Optimization (PSO), aplicado na otimização de quatro conhecidas arquiteturas convolucionais: AlexNet, VGGNet, ResNet e DenseNet e para resolução de três problemas de diagnóstico médico. Procurando-se identificar a solução que proporciona o melhor desempenho com a menor complexidade possível. Os resultados obtidos demonstraram a eficácia e a rapidez do PSO na identificação de soluções efetivas, sendo alcançados resultados superiores comparativamente a outras abordagens, em duas das três benchmarks em estudo. A técnica ensemble proposta permitiu a obtenção de um F1Score macroAVG de 91.1% e de 96.6%, respetivamente, para as benchmarks Breast Histopathology e Colorectal Histopathology. Os modelos estão disponíveis numa plataforma web que possibilita a realização de diagnósticos de imagens biomédicas, através do uso e da partilha de modelos convolucionais na plataforma. A plataforma demonstrou ser extremamente eficiente e célere na resposta ao diagnóstico de imagens, sendo obtidas as previsões num intervalo inferior a 10 segundos. O seu acesso é público e está disponível no repositório https://github.com/bundasmanu/ProjetoMestrado

    Índices espectrais baseados em programação genética para classificação de imagens de sensoriamento remoto

    Get PDF
    Orientador: Ricardo da Silva TorresDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Sensoriamento remoto é o conjunto de técnicas que permitem, por meio de sensores, analisar objetos a longas distâncias sem estabelecer contato físico com eles. Atualmente, sua contribuição em ciências naturais é enorme, dado que é possível adquirir imagens de alvos em mais regiões do espectro eletromagnético além do canal visível. Trabalhar com imagens compostas por múltiplas bandas espectrais requer tratar grandes quantidades de informação associada a uma única entidade, coisa que afeta negativamente o desempenho de algoritmos de predição, fazendo nacessário o uso de técnicas de redução da dimensionalidade. Este trabalho apresenta uma abordagem de extração de características baseada em índices espectrais aprendidos por Programação Genética (GP), que projetam os dados associados aos pixels em novos espaços de características, com o objetivo de aprimorar a acurácia de algoritmos de classificação. Índices espectrais são funções que relacionam a refletância, em canais específicos do espectro, com valores reais que podem ser interpretados como a abundância de características de interesse de objetos captados à distância. Com GP é possível aprender índices que maximizam a separabilidade de amostras de duas classes diferentes. Assim que os índices especializados para cada par possível de classes são obtidos, empregam-se duas abordagens diferentes para combiná-los e construir um sistema de classificação de pixels. Os resultados obtidos para os cenários binário e multi-classe mostram que o método proposto é competitivo com respeito a técnicas tradicionais de redução da dimensionalidade. Experimentos adicionais aplicando o método para análise sazonal de biomas tropicais mostram claramente a superioridade de índices aprendidos por GP para propósitos de discriminação, quando comparados a índices desenvolvidos por especialistas, independentemente da especificidade do problemaAbstract: Remote sensing is the set of techniques that allow, by means of sensor technologies, to analyze objects at long distances without making physical contact with them. Currently, its contribution for natural sciences is enormous, since it is possible to acquire images of target objects in more regions of the electromagnetic spectrum than the visible region only. Working with images composed of various spectral bands demands dealing with huge amounts of data associated with single entities, which affects negatively the performance in prediction tasks, and makes necessary the use of dimensionality reduction techniques. This work introduces a feature extraction approach, based on spectral indices learned by Genetic Programming (GP), to project data from pixel values into new feature spaces aiming to improve classification accuracy. Spectral indices are functions that map the reflectance of remotely sensed objects in specific wavelength intervals, into real scalars that can be interpreted as the abundance of features of interest. Through GP, it is possible to learn indices that maximize the separability of samples from two different classes. Once the indices specialized for all the pairs of classes are obtained, they are used in two different approaches to fuse them into a pixel classification system. Results for the binary and multi-class scenarios show that the proposed method is competitive with respect to traditional dimensionality reduction techniques. Additional experiments in tropical biomes seasonal analysis show clearly how superior GP-based spectral indices are for discrimination purposes, when compared to indices developed by experts, regardless the specificity of the problemMestradoCiência da ComputaçãoMestre em Ciência da Computação134089/2015-4CNP

    Google Earth™ search engine: classificação de imagens aéreas

    Get PDF
    O reconhecimento de padrões com recurso a redes neuronais é cada vez mais utilizado, numa tentativa de dotar as máquinas computacionais de inteligência e capacidade de aprendizagem. Neste trabalho pretende-se reconhecer determinados elementos naturais como ’água’, ’casas’ ou ’estradas’, em imagens aéreas provenientes do Google EarthTMe do Google MapsTM, recorrendo à utilizando redes neuronais para o efeito. Foram realizadas experiências com quatro conjuntos de imagens utilizados para o treino da rede neuronal, com variação de número de neurónios, e foram analisados os erros de classificação testando cinco novos conjuntos de imagens. Foram ainda realizadas diversas experiências quanto aos métodos de extração de características e à aplicação de operadores morfológicos com diferentes elementos estruturais visando o pós-processamento dos resultados obtidos.Pattern recognition using neural networks is increasingly used in an attempt to provid to machines computational intelligence and learning ability. This work aims to recognize certain natural elements like ’water’, ’house’ or ’roads’ in aerial images from Google Earth TMand Google Maps TM, resorting to using neural networks for the purpose. Experiments were performed with four sets of images used for training the neural network, with varying number of neurons, and analyzed the classification errors by testing five new sets of images. Were also carried out several experiments on methods of feature extraction and application of morphological operators with different structural elements aimed at the post-processing of results
    corecore