Search CORE

10 research outputs found

Hand Printed Character Recognition Using Neural Networks

Author: Hanmandlu Madasu
Lovell Brian C.
Madasu Vamsi K.
Publication venue
Publication date: 01/01/2005
Field of study

In this paper an attempt is made to recognize hand-printed characters by using features extracted using the proposed sector approach. In this approach, the normalized and thinned character image is divided into sectors with each sector covering a fixed angle. The features totaling 32 include vector distances, angles, occupancy and end-points. For recognition, both neural networks and fuzzy logic techniques are adopted. The proposed approach is implemented and tested on hand-printed isolated character database consisting of English characters, digits and some of the keyboard special characters

University of Queensland eSpace

Applying OCR in the Processing of Thermal Images with Temperature Scales

Author: Chan W. T.
Lo T. Y.
Sim K. S.
Tso C. P.
Publication venue: 'IntechOpen'
Publication date: 07/11/2012
Field of study

IntechOpen

Robust Character Recognition in Low-Resolution Images and Videos

Author: Effelsberg Wolfgang
Haenselmann Thomas
Kopf Stephan
Publication venue
Publication date: 01/01/2005
Field of study

Although OCR techniques work very reliably for high-resolution documents, the recognition of superimposed text in low-resolution images or videos with a complex background is still a challenge. Three major parts characterize our system for recognition of superimposed text in images and videos: localization of text regions, segmentation (binarization) of characters, and recognition. We use standard approaches to locate text regions and focus in this paper on the last two steps. Many approaches (e.g., projection profiles, k-mean clustering) do not work very well for separating characters with very small font sizes. We apply in a vertical direction a shortest-path algorithm to separate the characters in a text line. The recognition of characters is based on the curvature scale space (CSS) approach which smoothes the contour of a character with a Gaussian kernel and tracks its inflection points. A major drawback of the CSS method is its poor representation of convex segments: Convex objects cannot be represented at all due to missing inflection points. We have extended the CSS approach to generate feature points for concave and convex segments of a contour. This generic approach is not only applicable to text characters but to arbitrary objects as well. In the experimental results, we compare our approach against a pattern matching algorithm, two classification algorithms based on contour analysis, and a commercial OCR system. The overall recognition results are good enough even for the indexing of low resolution images and videos

MAnnheim DOCument Server

Adaptive foreground segmentation using fuzzy approach

Author: Yao Huajing
Publication venue: 'University of Windsor Leddy Library'
Publication date: 01/01/2009
Field of study

Intelligent visual surveillance which attempts to detect, recognize and track certain objects from image sequences is becoming an active research topic in computer vision community. Background modeling and foreground segmentation are the first two and the most important steps in any intelligent visual surveillance systems. The accuracy of these two steps highly effects performance of the following steps. In this thesis, we propose a simple and novel method which employs histogram based median method for background modeling and a fuzzy k-Means clustering approach for foreground segmentation. Experiments on a set of videos and benchmark image sequences show the effectiveness of the proposed method. Compared with other two contemporary methods - k -Means clustering and Mixture of Gaussians (MoG) - the proposed method is not only time efficient but also provides better segmentation results

Scholarship at UWindsor

Discrete-time modelling of diffusion processes for room acoustics simulation and analysis

Author: Navarro Ruiz Juan Miguel
Publication venue: 'Universitat Politecnica de Valencia'
Publication date: 02/03/2012
Field of study

Esta tesis está centrada en el modelado de la acústica de salas en espacios cerrados mediante el uso de una ecuación de transferencia radiativa y una ecuación de difusión En este trabajo se investiga cómo a través de estos modelos teóricos se pueden simular el campo sonoro en espacios complejos. Recientemente, el modelo de la ecuación de fusión ha sido prppuesto para ser utilizado en el modelado de la acústica de salas con superficies que reflejan el sonido de forma totalmente difusa. Este enfoque del uso de la ecuación de la disusión de sido intensamente investigado en los últimos años, ya que proporciona una alta eficiencia y flexibilidad para simular las distribuciones del campo sonoro en diferentes tipos de salas; sin embargo, sólo se han realizado unas pocas investigaciones con el objetivo de indagar sobre la precisión y las limitaciones de este método alternativo. Por lo tanto, en primer lugar se presenta un modelo basado en la ecuación de transferencia por radiación siendo meta principal el unificar una amplia gama de métodos geométricos de modelado de acústica de salas. Además, esta tesis está especialmente dedicada a establecer las bases y suposiciones que permitan obtener un modelo de difusión acústica como particularización del modelo de transferencia radiativa con el objetivo de conseguir una descripción clara y adecuada de sus ventajas y limitaciones desde el punto de vista teórico. Este trabajo permite enlazar directamente al modelo de la ecuación de difusión con el grupo de métodos de la acústica geométrica reforzando sus características y permitiendo una adecuada comparación con estos métodos ampliamente reconocidos. Una vez realizado este análisis teórico, esta tesis también se dedica a cuestiones relativas a la implementación numérica del modelo acústico de la ecuación de difusión . En este trabajo, se modela el campo sonoro a través de esquemas en diferencias finitas. Los resultados de este estudio proporcionan soluciones simples y practicas que muestran unos requerimientos computacionales bajos tanto de consumo de memoria como de tiempo.Navarro Ruiz, JM. (2012). Discrete-time modelling of diffusion processes for room acoustics simulation and analysis [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1486

RiuNet

Advances in Character Recognition

Author
Publication venue: 'IntechOpen'
Publication date: 20/04/2021
Field of study

This book presents advances in character recognition, and it consists of 12 chapters that cover wide range of topics on different aspects of character recognition. Hopefully, this book will serve as a reference source for academic research, for professionals working in the character recognition field and for all interested in the subject

Directory of Open Access Books (DOAB)

Contributions to the content-based image retrieval using pictorial queries

Author: Borràs Angosto Agnés
Universitat Autònoma de Barcelona. Departament de Ciències de la Computació
Publication venue: Bellaterra: Universitat Autònoma de Barcelona,
Publication date: 01/01/2010
Field of study

Descripció del recurs: el 02 de novembre de 2010L'accés massiu a les càmeres digitals, els ordinadors personals i a Internet, ha propiciat la creació de grans volums de dades en format digital. En aquest context, cada vegada adquireixen major rellevància totes aquelles eines dissenyades per organitzar la informació i facilitar la seva cerca. Les imatges són un cas particular de dades que requereixen tècniques específiques de descripció i indexació. L'àrea de la visió per computador encarregada de l'estudi d'aquestes tècniques rep el nom de Recuperació d'Imatges per Contingut, en anglès Content-Based Image Retrieval (CBIR). Els sistemes de CBIR no utilitzen descripcions basades en text sinó que es basen en característiques extretes de les pròpies imatges. En contrast a les més de 6000 llengües parlades en el món, les descripcions basades en característiques visuals representen una via d'expressió universal. La intensa recerca en el camp dels sistemes de CBIR s'ha aplicat en àrees de coneixement molt diverses. Així doncs s'han desenvolupat aplicacions de CBIR relacionades amb la medicina, la protecció de la propietat intel·lectual, el periodisme, el disseny gràfic, la cerca d'informació en Internet, la preservació dels patrimoni cultural, etc. Un dels punts importants d'una aplicació de CBIR resideix en el disseny de les funcions de l'usuari. L'usuari és l'encarregat de formular les consultes a partir de les quals es fa la cerca de les imatges. Nosaltres hem centrat l'atenció en aquells sistemes en què la consulta es formula a partir d'una representació pictòrica. Hem plantejat una taxonomia dels sistemes de consulta en composada per quatre paradigmes diferents: Consulta-segons-Selecció, Consulta-segons-Composició-Icònica, Consulta-segons-Esboç i Consulta-segons-Il·lustració. Cada paradigma incorpora un nivell diferent en el potencial expressiu de l'usuari. Des de la simple selecció d'una imatge, fins a la creació d'una il·lustració en color, l'usuari és qui pren el control de les dades d'entrada del sistema. Al llarg dels capítols d'aquesta tesi hem analitzat la influència que cada paradigma de consulta exerceix en els processos interns d'un sistema de CBIR. D'aquesta manera també hem proposat un conjunt de contribucions que hem exemplificat des d'un punt de vista pràctic mitjançant una aplicació final

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Diposit Digital de Documents de la UAB

Contributions to the Content-Based Image Retrieval Using Pictorial Queris

Author: Borràs Agnosto Agnès
Publication venue: 'Universitat Autonoma de Barcelona'
Publication date: 01/01/2009
Field of study

L'accés massiu a les càmeres digitals, els ordinadors personals i a Internet, ha propiciat la creació de grans volums de dades en format digital. En aquest context, cada vegada adquireixen major rellevància totes aquelles eines dissenyades per organitzar la informació i facilitar la seva cerca.Les imatges són un cas particular de dades que requereixen tècniques específiques de descripció i indexació. L'àrea de la visió per computador encarregada de l'estudi d'aquestes tècniques rep el nom de Recuperació d'Imatges per Contingut, en anglès Content-Based Image Retrieval (CBIR). Els sistemes de CBIR no utilitzen descripcions basades en text sinó que es basen en característiques extretes de les pròpies imatges. En contrast a les més de 6000 llengües parlades en el món, les descripcions basades en característiques visuals representen una via d'expressió universal.La intensa recerca en el camp dels sistemes de CBIR s'ha aplicat en àrees de coneixement molt diverses. Així doncs s'han desenvolupat aplicacions de CBIR relacionades amb la medicina, la protecció de la propietat intel·lectual, el periodisme, el disseny gràfic, la cerca d'informació en Internet, la preservació dels patrimoni cultural, etc. Un dels punts importants d'una aplicació de CBIR resideix en el disseny de les funcions de l'usuari. L'usuari és l'encarregat de formular les consultes a partir de les quals es fa la cerca de les imatges. Nosaltres hem centrat l'atenció en aquells sistemes en què la consulta es formula a partir d'una representació pictòrica. Hem plantejat una taxonomia dels sistemes de consulta en composada per quatre paradigmes diferents: Consulta-segons-Selecció, Consulta-segons-Composició-Icònica, Consulta-segons-Esboç i Consulta-segons-Il·lustració. Cada paradigma incorpora un nivell diferent en el potencial expressiu de l'usuari. Des de la simple selecció d'una imatge, fins a la creació d'una il·lustració en color, l'usuari és qui pren el control de les dades d'entrada del sistema. Al llarg dels capítols d'aquesta tesi hem analitzat la influència que cada paradigma de consulta exerceix en els processos interns d'un sistema de CBIR. D'aquesta manera també hem proposat un conjunt de contribucions que hem exemplificat des d'un punt de vista pràctic mitjançant una aplicació final

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Tesis Doctorals en Xarxa

Secretaría de Estado de Cultura