33 research outputs found

    Detection of ambiguous patterns in a SOM based recognition system: application to handwritten numeral classification

    Get PDF
    This work presents a system for pattern recognition that combines a self-organising unsupervised technique (via a Kohonen-type SOM) with a bayesian strategy in order to classify input patterns from a given probability distribution and, at the same time, detect ambiguous cases and explain answers. We apply the system to the recognition of handwritten digits. This proposal is intended as an improvement of a model previously introduced by our group, consisting basically of a hybrid unsupervised, self-organising model, followed by a supervised stage. Experiments were carried out on the handwritten digit database of the Concordia University, which is generally accepted as one of the standards in most of the literature in the field

    Pattern recognition using statistical techniques and neural networks: application to handwritten digit classification

    Get PDF
    El Reconocimiento de Patrones es el estudio de cómo las máquinas pueden observar el ambiente o entorno, aprender a distinguir patrones de interés a partir de la experiencia, y tomar decisiones razonables con respecto a las categorías a las que pertenecen dichos patrones. El mejor reconocedor de patrones conocido hasta ahora es el ser humano, no sabiéndose a ciencia cierta cuál es el proceso mediante el cual los humanos realizamos esta tarea. El Reconocimiento Optico de Caracteres (OCR) es uno de los tópicos más antiguos dentro del Reconocimiento de Patrones y una de las areas de investigación más importante y activa, que en la actualidad presenta desafío: la precisión en el reconocimiento asociada tanto a caracteres impresos en una imagen degradada o a caracteres manuscritos es aún insuficiente, existiendo errores en el reconocimiento. El Reconocimiento de Dígitos Manuscritos es un tema destacado dentro de OCR, por las aplicaciones relacionadas, como el procesamiento automático de cheques bancarios, la clasificación de correo en base a la lectura de códigos postales, la lectura automática de formularios y documentos con escritura manuscrita, dispositivos de lectura para ciegos, reconocimiento de escritura en computadoras manuales PDA, y porque constituye un problema modelo que incluye desafíos comunes con otros tópicos. Por esta razón, es tomado como referencia para la aplicación y testeo de nuevas teorías y algoritmos del area de Reconocimiento de Patrones en general. En este trabajo de tesis de doctorado se propone una nueva estrategia Bayesiana de combinación de clasificadores que permite detectar ambigüedades y resolverlas, lo que constituye la novedad y principal contribución de la tesis. Se propone, a su vez, un sistema completo de reconocimiento de patrones en dos niveles, con una arquitectura modular y paralelizable, que utiliza distintas características extraídas de los patrones de entrada según el problema a resolver junto con la estrategia Bayesiana ya mencionada que decide la respuesta del sistema. Como elementos componentes del reconocedor, en una primera capa o nivel, se utilizan clasificadores relativamente sencillos y bien posicionados para el problema a tratar. Los elementos pertenecientes a la segunda capa se utilizan para estimar cuán confiable es la respuesta de cada clasificador individual frente a un patrón de entrada, permitiendo decidir cuándo un patrón debe ser considerado bien definido o ambiguo, y en este ultimo caso con qué clases podrá confundirse. Adicionalmente, se proponen y aplican estrategias de selección de clasificadores en la etapa de construcción del reconocedor. El sistema reconocedor de patrones presentado fue aplicado al problema del reconocimiento de dígitos manuscritos off-line, como forma de testear su desempeño. En función de esto, se proponen descriptores basados en características de multirresolución a través del uso de la Transformada Wavelet CDF 9/7 y de Análisis de Componentes Principales, que permiten disminuir considerablemente el tamaño del patrón de entrada y aumentar la calidad de la representación. La experimentación se realizó sobre las bases de datos CENPARMI y MNIST, ampliamente referenciadas para este problema. Se obtuvieron altos porcentajes en el reconocimiento que alcanzaron un 97,40 y 99,32 % para las bases CENPARMI y MNIST respectivamente. Dichos valores son comparables a los resultados publicados considerados representativos.Pattern Recognition is the study of how machines can observe the environment, learn to distinguish patterns of interest from their background, and make sound and reasonable decisions about the categories of the patterns. The best pattern recognizers in most instances are humans, yet we do not understand how humans recognize patterns. Optical character recognition (OCR) is one of the most traditional topics in the context of Pattern Recognition that includes as a key issue the automatic recognition of handwritten characters. The subject has many interesting applications, such as automatic recognition of postal codes, recognition of amounts in banking checks and automatic processing of application forms. Handwritten numeral classification is a difficult task because of the wide variety of styles, strokes and orientations of digit samples. One of the main difficulties lies in the fact that the intra-class variance is high, due to the different forms associated with the same pattern, because of the particular writing style of each individual. Many models have been proposed to deal with this problem, but none of them has succeeded in obtaining levels of response comparable to human ones. This thesis presents a pattern recognition system that is able to detect ambiguous patterns and ex- plain its answers using a Bayesian strategy which is the main contribution of this work. The recogniser is composed of two levels. The first one is formed by a collection of independent classifiers, each one spe- cialised in a different feature extracted from the input pattern. The second level consists of an analyzing module in charge of defining and explaining the output of the system. This module is integrated by the following elements: the table of reliability and two parameters adjustable while running the system. The system has been applied to the off-line recognition of handwritten digits. Descriptors based on the CDF 9/7 wavelet transform and Principal Component Analysis are proposed in order to reduce the size of the input pattern while increasing the quality of its representation. Strategies for selecting classifiers for the system are also proposed. The experiments were carried out on the MNIST and CENPARMI handwritten digit databases, which are generally accepted as standards in most of the literature in the field. Recognition rates obtained are comparable with results from representative work, reaching 97.40 and 99.32 % for CENPARMI and MNIST databases respectively.Fil:Seijas, Leticia María. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina

    Modelos conexionistas auto-organizados y su aplicación en reconocimiento de patrones

    Get PDF
    El trabajo en curso tiene por objeto desarrollar técnicas conexionistas para reconocimiento de patrones. A partir del sistema ya desarrollado por el grupo (que consiste básicamente en un modelo híbrido no supervisado -de tipo autoorganizado- seguido de una instancia supervisada) se estudia la introducción de innovaciones que incrementen su potencia y su eficiencia. Las investigaciones en curso giran alrededor de dos frentes: i) preprocesamiento de la entrada: se consideran opciones a la técnica inicialmente empleada (máscaras de Kirsch), entre ellas el uso de transformadas wavelet y la extracción de componentes principales; ii) estructura del módulo intermedio (no supervisado): analizamos posibles sofisticaciones orientadas a obtener una clasificación más especializada de acuerdo con las características de la distribución de los datos de entrada. La calidad y eficiencia de la propuesta resultante deberán ser luego comparadas con las de los métodos ya existentes.Eje: Inteligencia artificialRed de Universidades con Carreras en Informática (RedUNCI

    Modelos conexionistas auto-organizados y su aplicación en reconocimiento de patrones

    Get PDF
    El trabajo en curso tiene por objeto desarrollar técnicas conexionistas para reconocimiento de patrones. A partir del sistema ya desarrollado por el grupo (que consiste básicamente en un modelo híbrido no supervisado -de tipo autoorganizado- seguido de una instancia supervisada) se estudia la introducción de innovaciones que incrementen su potencia y su eficiencia. Las investigaciones en curso giran alrededor de dos frentes: i) preprocesamiento de la entrada: se consideran opciones a la técnica inicialmente empleada (máscaras de Kirsch), entre ellas el uso de transformadas wavelet y la extracción de componentes principales; ii) estructura del módulo intermedio (no supervisado): analizamos posibles sofisticaciones orientadas a obtener una clasificación más especializada de acuerdo con las características de la distribución de los datos de entrada. La calidad y eficiencia de la propuesta resultante deberán ser luego comparadas con las de los métodos ya existentes.Eje: Inteligencia artificialRed de Universidades con Carreras en Informática (RedUNCI

    Un clasificador neuronal que explica sus respuestas: aplicación al reconocimiento de dígitos manuscritos

    Get PDF
    En este trabajo se presenta un sistema reconocedor de patrones con un diseño modular, explicativo y altamente paralelizable, basado en una técnica híbrida de aprendizaje, que incluye la utilización de mapas auto-organizativos de Kohonen. Dicho sistema se aplica al tratamiento de un problema real: el reconocimiento de dígitos manuscritos sin restricciones, obteniéndose resultados competitivos con los publicados por otros autores. El sistema propuesto no sólo permite clasificar patrones; también permite explicar las respuestas dadas y detectar patrones ambiguos, indicando a qué otras clases podrían pertenecer. Además, los mapas Kohonen utilizados, muestran gráficamente la distribución de los datos de entrenamiento, contribuyendo también a la explicación de las respuestas. La utilización de varias características representativas extraídas de los datos de entrada durante la etapa previa de preprocesamiento, y el tratamiento de las mismas en forma independiente, contribuye a la modularidad del sistema y a la posibilidad de entrenarlo en forma paralela. El uso de dichas características permite, además, que la presencia de errores en los patrones de entrada no tenga gran influencia en la respuesta del sistema.Eje: Agentes y Sistemas Inteligentes (ASI)Red de Universidades con Carreras en Informática (RedUNCI

    Palynological, physicochemical, and microbiological attributes of organic lavender (Lava ndula stoechas) honey from Portugal

    Get PDF
    At the present time, the quality, integrity, sanitation, and nutritional value of honeys receive attention on an international level due to the increasing content of chemicals in the aforementioned matrix. The present study aims to characterize organic honey (n=73) from Northeast Portugal, with respect to floral nectar origin, physicochemical parameters, microbial safety, and commercial quality. All organic honey samples can be classified as monofloral lavender (Lavandula stoechas L.), exceed in quality the international physicochemical standards, and show low microbiological counts (yeast, moulds, and aerobic mesophiles), with negative results in respect to faecal coliforms, Salmonella, and sulphite-reducing clostridia. Correlating the palynological, physicochemical, and microbiological results is necessary in order to check the authenticity, quality, and sanitation of honey

    Organic honey from Trás-os-Montes region (Portugal): chemical, palynological, microbiological and bioactive compounds characterization

    Get PDF
    At the present time, the quality, integrity, sanitation and nutritional value of honeys receive attention on an international level due to the increasing content of chemicals in the aforementioned matrix. This work was conducted to evaluate the quality of 75 organic honey samples from the Trás-Os-Montes region (Portugal). Mean values obtained for physico-chemical parameters were: pH 3.7; 15.6% moisture; 0.26 mS/cm electrical conductivity; 0.25% ash; 1.1 mg/kg HMF; 15.3 Gothe diastase activity; 40.3 meq/kg free acidity; 67.8% invert sugars and 2.7% apparent sucrose. All honey samples can be classified as monofloral Erica sp., as showed by pollen features. The amounts of phenols and flavonoids in the samples were also determined. In respect to sanitary quality (fecal coliforms) and safety (sulfite-reducing clostridia and Salmonella), all organic honey samples were negative. Furthermore, yeast and molds were detected in low counts, with mean values obtained of 5.5 cfu/g and the value of total aerobic mesophiles obtained from honeys was established in 1.3 102 cfu/g ± 7.5 101 cfu/g. The levels of flavonoids had a stronger impact on both mesophiles (p = 0.0004) and molds (p = 0.0138) than the sucrose concentration (p = 0.001 and 0.0278; respectively). The results reported in this study should be introduced in the organic honey label, and may help beekeepers, the industry, researchers and consumers better understand honey properties

    Physicochemical and pollen analysis of Local honeys from the Lima Valley (Portugal)

    Get PDF
    An evaluation was done on the physicochemical quality of nineteen (n=19) Apis mellifera honeys produced in the Lima Valley, Portugal. The rural landscape of the Lima Valley is valuable in social, environmental and economic terms and its conservation and preservation are essential. The evaluated physicochemical characteristics were: moisture, ash, electrical conductivity, pH, hydroxymethylfurfural (HMF), free acidity, apparent sucrose, reducing sugars and diastase activity. All honey samples met the International physicochemical quality standards. A short study of pollen source was done by acetolisis method. The families Fabaceae and Rosaceae were found with 6 and 2 pollen types each respectively. The most important pollen source is Erica, moreover two samples are listed as Erica monofloral honey

    Detection of ambiguous patterns in a SOM based recognition system: application to handwritten numeral classification

    Get PDF
    This work presents a system for pattern recognition that combines a self-organising unsupervised technique (via a Kohonen-type SOM) with a bayesian strategy in order to classify input patterns from a given probability distribution and, at the same time, detect ambiguous cases and explain answers. We apply the system to the recognition of handwritten digits. This proposal is intended as an improvement of a model previously introduced by our group, consisting basically of a hybrid unsupervised, self-organising model, followed by a supervised stage. Experiments were carried out on the handwritten digit database of the Concordia University, which is generally accepted as one of the standards in most of the literature in the field

    Detection of ambiguous patterns in a SOM based recognition system: application to handwritten numeral classification

    Get PDF
    This work presents a system for pattern recognition that combines a self-organising unsupervised technique (via a Kohonen-type SOM) with a bayesian strategy in order to classify input patterns from a given probability distribution and, at the same time, detect ambiguous cases and explain answers. We apply the system to the recognition of handwritten digits. This proposal is intended as an improvement of a model previously introduced by our group, consisting basically of a hybrid unsupervised, self-organising model, followed by a supervised stage. Experiments were carried out on the handwritten digit database of the Concordia University, which is generally accepted as one of the standards in most of the literature in the field
    corecore