15 research outputs found

    Reconhecimento de Padrões de Texturas em Imagens Digitais Usando uma Rede Neural Artificial Híbrida

    Get PDF
    Este trabalho apresenta um mecanismo de indexação de imagens baseado em características texturais utilizando redes neurais artificiais. Os atributos que descrevem as texturas e que são utilizados para classificá-las advêm dos descritores de Haralick os quais são baseados em matrizes de coocorrência. Uma rede neural híbrida é utilizada para reconhecer os diferentes padrões de texturas. Primeiramente, é realizado um agrupamento inicial dos padrões por um modelo não supervisionado (Mapas Auto-organizáveis) e numa segunda fase, utiliza-se o modelo supervisionado (Quantização Vetorial por Aprendizagem) para melhorar a segmentação das classes de padrões previamente agrupados pelo modelo não supervisionado.&nbsp

    Reconhecimento de Padrões de Texturas em Imagens Digitais Usando uma Rede Neural Artificial Híbrida

    Get PDF
    Este trabalho apresenta um mecanismo de indexação de imagens baseado em características texturais utilizando redes neurais artificiais. Os atributos que descrevem as texturas e que são utilizados para classificá-las advêm dos descritores de Haralick os quais são baseados em matrizes de coocorrência. Uma rede neural híbrida é utilizada para reconhecer os diferentes padrões de texturas. Primeiramente, é realizado um agrupamento inicial dos padrões por um modelo não supervisionado (Mapas Auto-organizáveis) e numa segunda fase, utiliza-se o modelo supervisionado (Quantização Vetorial por Aprendizagem) para melhorar a segmentação das classes de padrões previamente agrupados pelo modelo não supervisionado.

    not available

    No full text
    A extração de informações textuais em imagens e vídeo é um problema importante em visão computacional que está presente em muitas aplicações, tais como a localização de endereços em cartão postal, localização do número do licenciamento em placa veicular, indexção de conteúdo baseado em imagens e vídeo, sistema de apoio a deficientes visuais, entre outras. Tal problema pode ser subdividido em cinco subproblemas: (1) detecção, (2) localização, (3) rastreamento, (4) extração e realce, (5) reconhecimento. O foco desse trabalho é explorar o segundo subproblema, istoé, o problema de localização de textos, cujo objetivo principal élocalizar dentro da imagem de entrada as regiões cmo presença de textos. Em especial, é tratado o problema de localização de texto para uma categoria de imagens conhecida como imagens de cena. Nesta categoria de imagens os textos presentes são considerados partes integrantes de uma cena e estão presentesquase sempre de maneira acidental a não proposital. Devido a esse fator, a ocorrência de texto nessas imagens pode diferir significativamente quanto à sua inclinação, seu tamanho, seu estilo de fonte, sua iluminação e também pode estar parcialmente ocluso. Dadas essas considerações, esse trabalho tem como objetivo principal apresentar um novo método para localização de texto para imagens de cenas, o qual consiste de duas grandes etapas (uma seguida da outra): extração de regiões de texto candidatas e classificação de regiões de texto. Na primeira etapa, um conjunto de regiões de texto candidatas é extraído da imagem de entrada por meio de uma combinação robusta de operadores morfológicos e, na segunda etapa, é extraído de cada região de texto candidata um conjunto de atributos para depois classificá-la em região de texto ou não-texto.not availabl

    Ultimate levelings: concepts, properties, algorithms and applications for image processing and analysis

    No full text
    Em Morfologia Matemática diversos operadores são definidos pela diferença entre outros dois operadores, como por exemplo, o gradiente morfológico, definido como a diferença entre a dilatação e a erosão. Estes operadores são denominados operadores residuais, sendo alguns deles definidos por valores residuais extraídos de famílias indexadas de operadores, como por exemplo, o esqueleto por discos maximais e a última abertura. Neste sentido, visa-se neste trabalho investigar a extração de informações residuais em famílias indexadas de operadores. Mais precisamente, em famílias de operadores conexos conhecidos como levelings. Os levelings são operadores que não criam novas estruturas (contornos e extremos regionais) e seus valores são limitados pelos valores da imagem de referência. Assim, é apresentada nesta tese uma classe de operadores residuais denominada últimos levelings, a qual consiste de poderosos operadores residuais definidos a partir de resíduos gerados por operadores consecutivos de um espaço de escala baseado em levelings. Dessa forma, objetos contrastantes podem ser detectados se relevantes resíduos são gerados quando eles são filtrados por um desses levelings. Os valores residuais revelam importantes informações sobre contrastes presentes em uma imagem. Além dos valores residuais, outras informações associadas com eles podem ser obtidas no momento da extração residual, tais como os índices dos operadores que produziram os valores residuais. Com base nessas considerações, as principais contribuições originais desta pesquisa, incluem: (i) demonstrar que árvores construídas a partir de conjuntos de níveis representam espaços de escalas baseados em levelings; (ii) introduzir a classe dos últimos levelings, passando por definições, conceitos, algoritmos, propriedades e relações com outros operadores conhecidos na literatura; (iii) apresentar estratégias para construção de operadores últimos levelings. Por fim, são apresentadas aplicações dos últimos levelings em problemas de análise e processamento de imagens.In Mathematical Morphology several operators are defined by the difference between two operators, such as morphological gradient, defined as the difference between the dilation and erosion. These operators are called residual operators, being that some are defined by the extracted residual values from of an indexed family of operators, for example, the skeleton by maximal discs and the ultimate opening. In this sense, we intend to investigate the extraction of residual information in families of operators. More precisely, in families of connected operators known as levelings. The levelings are operators that do not create new structures (contours and regional extremes) and their values are limited by the values of the reference image. Thus, we present in this thesis a class of residual operators named ultimate levelings, which consist of powerful residual operators defined from a scale space based on levelings. With a multi-scale approach, these operators analyze an image under a series of levelings. Thus, contrasted objects can be detected if a relevant residue is generated when they are filtered out by one of these levelings. The residual values reveal important informations about contrasts present in an image. In addition of residual values, other information associated with them can be obtained at the time of extraction residual, such as the indexes of operators who produced the residual values. Based on these considerations, the main original contributions of this research include: (i) demonstrate that the trees constructed from level sets represent an scale space based on levelings; (ii) introduce the class of levelings ultimate, passing by definitions, concepts, algorithms, properties and relationships with other known operators in the literature; (iii) show some strategies for building levelings ultimate operators. Finally, we present applications of levelings ultimate in problem of image processing and analysis

    Classification of regions extracted from scene images by morphological filters in text or non-text using decision tree

    Get PDF
    We present in this work a new method to classify regions extracted from scene images by morphological filters in text or nontext region using a decision tree. Our technique can be divided into three parts. Firstly, we extract a set of regions by a robust scheme based on morphological filters. Then, after a refinement, a set of text attributes is obtained for each region. In the last step, a decision tree is built in order to classify them as text or non-text regions. Experiments performed using images from the ICDAR public dataset show that this method is a good alternative for practical problems involving text location in scene images
    corecore