10 research outputs found

    Hand Printed Character Recognition Using Neural Networks

    Get PDF
    In this paper an attempt is made to recognize hand-printed characters by using features extracted using the proposed sector approach. In this approach, the normalized and thinned character image is divided into sectors with each sector covering a fixed angle. The features totaling 32 include vector distances, angles, occupancy and end-points. For recognition, both neural networks and fuzzy logic techniques are adopted. The proposed approach is implemented and tested on hand-printed isolated character database consisting of English characters, digits and some of the keyboard special characters

    Robust Character Recognition in Low-Resolution Images and Videos

    Get PDF
    Although OCR techniques work very reliably for high-resolution documents, the recognition of superimposed text in low-resolution images or videos with a complex background is still a challenge. Three major parts characterize our system for recognition of superimposed text in images and videos: localization of text regions, segmentation (binarization) of characters, and recognition. We use standard approaches to locate text regions and focus in this paper on the last two steps. Many approaches (e.g., projection profiles, k-mean clustering) do not work very well for separating characters with very small font sizes. We apply in a vertical direction a shortest-path algorithm to separate the characters in a text line. The recognition of characters is based on the curvature scale space (CSS) approach which smoothes the contour of a character with a Gaussian kernel and tracks its inflection points. A major drawback of the CSS method is its poor representation of convex segments: Convex objects cannot be represented at all due to missing inflection points. We have extended the CSS approach to generate feature points for concave and convex segments of a contour. This generic approach is not only applicable to text characters but to arbitrary objects as well. In the experimental results, we compare our approach against a pattern matching algorithm, two classification algorithms based on contour analysis, and a commercial OCR system. The overall recognition results are good enough even for the indexing of low resolution images and videos

    Adaptive foreground segmentation using fuzzy approach

    Get PDF
    Intelligent visual surveillance which attempts to detect, recognize and track certain objects from image sequences is becoming an active research topic in computer vision community. Background modeling and foreground segmentation are the first two and the most important steps in any intelligent visual surveillance systems. The accuracy of these two steps highly effects performance of the following steps. In this thesis, we propose a simple and novel method which employs histogram based median method for background modeling and a fuzzy k-Means clustering approach for foreground segmentation. Experiments on a set of videos and benchmark image sequences show the effectiveness of the proposed method. Compared with other two contemporary methods - k -Means clustering and Mixture of Gaussians (MoG) - the proposed method is not only time efficient but also provides better segmentation results

    Discrete-time modelling of diffusion processes for room acoustics simulation and analysis

    Full text link
    Esta tesis est谩 centrada en el modelado de la ac煤stica de salas en espacios cerrados mediante el uso de una ecuaci贸n de transferencia radiativa y una ecuaci贸n de difusi贸n En este trabajo se investiga c贸mo a trav茅s de estos modelos te贸ricos se pueden simular el campo sonoro en espacios complejos. Recientemente, el modelo de la ecuaci贸n de fusi贸n ha sido prppuesto para ser utilizado en el modelado de la ac煤stica de salas con superficies que reflejan el sonido de forma totalmente difusa. Este enfoque del uso de la ecuaci贸n de la disusi贸n de sido intensamente investigado en los 煤ltimos a帽os, ya que proporciona una alta eficiencia y flexibilidad para simular las distribuciones del campo sonoro en diferentes tipos de salas; sin embargo, s贸lo se han realizado unas pocas investigaciones con el objetivo de indagar sobre la precisi贸n y las limitaciones de este m茅todo alternativo. Por lo tanto, en primer lugar se presenta un modelo basado en la ecuaci贸n de transferencia por radiaci贸n siendo meta principal el unificar una amplia gama de m茅todos geom茅tricos de modelado de ac煤stica de salas. Adem谩s, esta tesis est谩 especialmente dedicada a establecer las bases y suposiciones que permitan obtener un modelo de difusi贸n ac煤stica como particularizaci贸n del modelo de transferencia radiativa con el objetivo de conseguir una descripci贸n clara y adecuada de sus ventajas y limitaciones desde el punto de vista te贸rico. Este trabajo permite enlazar directamente al modelo de la ecuaci贸n de difusi贸n con el grupo de m茅todos de la ac煤stica geom茅trica reforzando sus caracter铆sticas y permitiendo una adecuada comparaci贸n con estos m茅todos ampliamente reconocidos. Una vez realizado este an谩lisis te贸rico, esta tesis tambi茅n se dedica a cuestiones relativas a la implementaci贸n num茅rica del modelo ac煤stico de la ecuaci贸n de difusi贸n . En este trabajo, se modela el campo sonoro a trav茅s de esquemas en diferencias finitas. Los resultados de este estudio proporcionan soluciones simples y practicas que muestran unos requerimientos computacionales bajos tanto de consumo de memoria como de tiempo.Navarro Ruiz, JM. (2012). Discrete-time modelling of diffusion processes for room acoustics simulation and analysis [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/1486

    Advances in Character Recognition

    Get PDF
    This book presents advances in character recognition, and it consists of 12 chapters that cover wide range of topics on different aspects of character recognition. Hopefully, this book will serve as a reference source for academic research, for professionals working in the character recognition field and for all interested in the subject

    Contributions to the content-based image retrieval using pictorial queries

    Get PDF
    Descripci贸 del recurs: el 02 de novembre de 2010L'acc茅s massiu a les c脿meres digitals, els ordinadors personals i a Internet, ha propiciat la creaci贸 de grans volums de dades en format digital. En aquest context, cada vegada adquireixen major rellev脿ncia totes aquelles eines dissenyades per organitzar la informaci贸 i facilitar la seva cerca. Les imatges s贸n un cas particular de dades que requereixen t猫cniques espec铆fiques de descripci贸 i indexaci贸. L'脿rea de la visi贸 per computador encarregada de l'estudi d'aquestes t猫cniques rep el nom de Recuperaci贸 d'Imatges per Contingut, en angl猫s Content-Based Image Retrieval (CBIR). Els sistemes de CBIR no utilitzen descripcions basades en text sin贸 que es basen en caracter铆stiques extretes de les pr貌pies imatges. En contrast a les m茅s de 6000 lleng眉es parlades en el m贸n, les descripcions basades en caracter铆stiques visuals representen una via d'expressi贸 universal. La intensa recerca en el camp dels sistemes de CBIR s'ha aplicat en 脿rees de coneixement molt diverses. Aix铆 doncs s'han desenvolupat aplicacions de CBIR relacionades amb la medicina, la protecci贸 de la propietat intel路lectual, el periodisme, el disseny gr脿fic, la cerca d'informaci贸 en Internet, la preservaci贸 dels patrimoni cultural, etc. Un dels punts importants d'una aplicaci贸 de CBIR resideix en el disseny de les funcions de l'usuari. L'usuari 茅s l'encarregat de formular les consultes a partir de les quals es fa la cerca de les imatges. Nosaltres hem centrat l'atenci贸 en aquells sistemes en qu猫 la consulta es formula a partir d'una representaci贸 pict貌rica. Hem plantejat una taxonomia dels sistemes de consulta en composada per quatre paradigmes diferents: Consulta-segons-Selecci贸, Consulta-segons-Composici贸-Ic貌nica, Consulta-segons-Esbo莽 i Consulta-segons-Il路lustraci贸. Cada paradigma incorpora un nivell diferent en el potencial expressiu de l'usuari. Des de la simple selecci贸 d'una imatge, fins a la creaci贸 d'una il路lustraci贸 en color, l'usuari 茅s qui pren el control de les dades d'entrada del sistema. Al llarg dels cap铆tols d'aquesta tesi hem analitzat la influ猫ncia que cada paradigma de consulta exerceix en els processos interns d'un sistema de CBIR. D'aquesta manera tamb茅 hem proposat un conjunt de contribucions que hem exemplificat des d'un punt de vista pr脿ctic mitjan莽ant una aplicaci贸 final

    Contributions to the Content-Based Image Retrieval Using Pictorial Queris

    Get PDF
    L'acc茅s massiu a les c脿meres digitals, els ordinadors personals i a Internet, ha propiciat la creaci贸 de grans volums de dades en format digital. En aquest context, cada vegada adquireixen major rellev脿ncia totes aquelles eines dissenyades per organitzar la informaci贸 i facilitar la seva cerca.Les imatges s贸n un cas particular de dades que requereixen t猫cniques espec铆fiques de descripci贸 i indexaci贸. L'脿rea de la visi贸 per computador encarregada de l'estudi d'aquestes t猫cniques rep el nom de Recuperaci贸 d'Imatges per Contingut, en angl猫s Content-Based Image Retrieval (CBIR). Els sistemes de CBIR no utilitzen descripcions basades en text sin贸 que es basen en caracter铆stiques extretes de les pr貌pies imatges. En contrast a les m茅s de 6000 lleng眉es parlades en el m贸n, les descripcions basades en caracter铆stiques visuals representen una via d'expressi贸 universal.La intensa recerca en el camp dels sistemes de CBIR s'ha aplicat en 脿rees de coneixement molt diverses. Aix铆 doncs s'han desenvolupat aplicacions de CBIR relacionades amb la medicina, la protecci贸 de la propietat intel路lectual, el periodisme, el disseny gr脿fic, la cerca d'informaci贸 en Internet, la preservaci贸 dels patrimoni cultural, etc. Un dels punts importants d'una aplicaci贸 de CBIR resideix en el disseny de les funcions de l'usuari. L'usuari 茅s l'encarregat de formular les consultes a partir de les quals es fa la cerca de les imatges. Nosaltres hem centrat l'atenci贸 en aquells sistemes en qu猫 la consulta es formula a partir d'una representaci贸 pict貌rica. Hem plantejat una taxonomia dels sistemes de consulta en composada per quatre paradigmes diferents: Consulta-segons-Selecci贸, Consulta-segons-Composici贸-Ic貌nica, Consulta-segons-Esbo莽 i Consulta-segons-Il路lustraci贸. Cada paradigma incorpora un nivell diferent en el potencial expressiu de l'usuari. Des de la simple selecci贸 d'una imatge, fins a la creaci贸 d'una il路lustraci贸 en color, l'usuari 茅s qui pren el control de les dades d'entrada del sistema. Al llarg dels cap铆tols d'aquesta tesi hem analitzat la influ猫ncia que cada paradigma de consulta exerceix en els processos interns d'un sistema de CBIR. D'aquesta manera tamb茅 hem proposat un conjunt de contribucions que hem exemplificat des d'un punt de vista pr脿ctic mitjan莽ant una aplicaci贸 final
    corecore