15 research outputs found

    Handwritten digit recognition using pseudo-2D Markov models

    Get PDF
    We present a new methodfor recognising handwritten characters based on pseudo– 2D Markov models. This method belongs to a class of techniques which attemp t to recover the prototype shape of a character starting from a distorted image . By contrast with popular approaches in this field, our method does not need an y explicit feature extraction and it outputs recognition scores which are estimate s of Bayes probabilities. It also allows an automatic training. One of its distinctive characteristics is the use of a truely bi–dimensional but causal model for th e estimation of probabilities . Lastly, we show how synthetic images of character s fitted to the statistical distribution of shapes in the training set can be generate d by this model.Nous présentons une nouvelle méthode de reconnaissance de caractères manuscrits fondée sur le principe des modèles de Markov pseudo-2D ou planaires (PHMM). Cette méthode se situe dans la classe des techniques qui tentent de rétablir la forme prototype d'un caractère à partir d'une version déformée de celle-ci. Contrairement aux approches souvent proposées dans ce domaine, notre méthode ne repose sur aucune extraction de traits explicite et produit des scores de reconnaissance qui sont des estimations des probabilités bayesiennes. Elle se prête à un apprentissage automatique. Une de ses caractéristiques distinctive est l'utilisation d'un modèle probabiliste (réseau de Markov) réellement bi-dimensionnel mais causal pour estimer les probabilités. Enfin, on montre comment on peut engendrer des images synthétiques des caractères possibles et ce suivant leur probabilité estimée par le modèle

    Processing of numerical check amounts. A segmentation-based approach

    Get PDF
    We present an automatic recognition system applied to handwritten numeral chec k amounts which is based on a segmentation–by–recognition probabilistic model . This system is descrided from the amount field localization on the document image to the generation ofhypotheses. An explicit segmentation algorithm determines potential cuts between characters and provides a spatial representation ofsegmented components . The best path for the segmentation is determined by the combinatio n of recognition scores, of segmentation likelihoods and of a priori probabilities of amounts. Training is done through a bootstrapping technique, which significantly improves the performances of the different algorithms . It also allows the use of a reject class at the recognition step . The robustness of the system was assessed on a database of 10,000 real cheques images.Nous présentons un système de lecture automatique des montants numériques des chèques dont le principe repose sur une technique de segmentation des caractères validée par la reconnaissance. Ce système est décrit depuis la phase de localisation du champ montant sur le document numérisé, jusqu'à la génération de la liste des hypothèses de montant. La segmentation, de type explicite, permet de déterminer des zones de coupure potentielles entre caractères et fournit une représentation spatiale des composantes segmentées. Le meilleur chemin de segmentation du montant est déterminé par la combinaison des scores de reconnaissance des caractères, de la vraisemblance de la segmentation et de la probabilité d'apparition de ce montant. Un apprentissage est effectué à partir d'un algorithme d'étiquetage automatique qui améliore nettement les performances des différents modules et a également permis l'intégration d'une classe rejet au niveau du module de reconnaissance. Afin de pouvoir quantifier la robustesse de ce système, nous avons mesuré ses performances à partir d'une base de 10 000 images de montants de chèques réels

    Address block location on flat mail pieces by a bottom-up segmentation method. Evaluation and optimization

    Get PDF
    We present a textual areas segmentation method for complex documents not or few structured. This method is applied to the address block location on large mail pieces . Among these objects, we have identified two main classes and we present a dedicated method for each . We then give more details about the optimization and evaluation of the implemented techniques .Nous présentons une méthode de segmentation des zones de texte sur des documents complexes, peu ou pas structurés. Cette méthode est appliquée à la localisation du bloc adresse sur les grands objets postaux. Parmi ces objets, nous avons identifié deux catégories principales et nous présentons une méthode adaptée à chacune. Nous portons enfin une attention particulière sur la phase d'optimisation des traitements et d'évaluation des performances

    RMO, Service de Recherche Technique de La Poste,

    No full text
    In this paper we introduce a new strategy for improving a discrete HMM-based handwriting recognition system, by integrating several information sources from specialized feature sets. For a given system, the basic idea is to keep the most discriminative features, and to replace the others with new ones obtained from new feature spaces. After evaluating the individual discriminative power of each single feature, the set is divided into two subsets: one containing the discriminative features, and the second the others. Considering feature classes in the nondiscriminative feature subset allows the specialization of new feature sets on specific problems. The application of this strategy to an existing system showed an improvement of 16 % in the recognition rate when a lexicon of 1000 city names was used.

    A NEW STRATEGY FOR IMPROVING FEATURE SETS IN A DISCRETE HMM­BASED HANDWRITING RECOGNITION SYSTEM

    Get PDF
    Microsoft, Motorola, Siemens, Hitachi, IAPR, NICI, IUF In this paper we introduce a new strategy for improving a discrete HMM­based handwriting recognition system, by integrating several information sources from specialized feature sets. For a given system, the basic idea is to keep the most discriminative features, and to replace the others with new ones obtained from new feature spaces. After evaluating the individual discriminative power of each single feature, the set is divided into two subsets: one containing the discriminative features, and the second the others. Considering feature classes in the non­ discriminative feature subset allows the specialization of new feature sets on specific problems. The application of this strategy to an existing system showed an improvement of 16% in the recognition rate when a lexicon of 1000 city names was used.
    corecore