116 research outputs found

    Language Models for Handwritten Short Message Services

    Get PDF
    International audienceHandwriting is an alternative method for entering texts composing Short Message Services. However, a whole new language features the texts which are produced. They include for instance abbreviations and other consonantal writing which sprung up for time saving and fashion. We have collected and processed a significant number of such handwriting SMS, and used various strategies to tackle this challenging area of handwriting recognition. We proposed to study more specifically three different phenomena: consonant skeleton, rebus, and phonetic writing. For each of them, we compare the rough results produced by a standard recognition system with those obtained when using a specific language model

    On-line hand-drawn electric circuit diagram recognition using 2D dynamic programming

    Get PDF
    9 pagesInternational audienceIn order to facilitate sketch recognition, most online existing works assume that people will not start to draw a new symbol before the current one has been finished. We propose in this paper a method that relaxes this constraint. The proposed methodology relies on a two-dimensional dynamic programming (2D-DP) technique allowing symbol hypothesis generation, which can correctly segment and recognize interspersed symbols. In addition, as discriminative classifiers usually have limited capability to reject outliers, some domain specific knowledge is included to circumvent those errors due to untrained patterns corresponding to erroneous segmentation hypotheses. With a point-level measurement, the experiment shows that the proposed novel approach is able to achieve an accuracy of more than 90 percent

    Language Independent Statistical Models for on-Line Handwriting Recognition

    Get PDF
    http://www.suvisoft.comThis paper deals with a language modeling approach that is dedicated to an on-line handwriting recognition system. Three main goals are set: i) performances, ii) versatility, and iii) resources. To achieve these goals we propose a statistical word n-class approach, which uses a learning stage to cluster words in classes and defines an estimation of the probability distribution of sequences of classes. Very large corpora from three different languages (English, French and Italian) have been used to train and test the language models. The efficiency of these models are evaluated not only from a linguistic point of view, using perplexity measurements, but also combined inside the recognition system on real ink signals corresponding to written sentences. Using a tri-class model allows a word error rate reduction ranging from to 50 to 60% according to the language

    Fusion de résultats en recherche d'information : application aux documents manuscrits en-ligne

    Get PDF
    Ce travail présente les résultats d'une étude sur la combinaison des deux approches majeures existantes pour la recherche de documents manuscrits en-ligne. La première approche consiste à appliquer des méthodes de recherche d'information (RI) aux documents issus d'un processus de reconnaissance. La deuxième, quant à elle, ne nécessite pas de reconnaissance explicite et utilise un algorithme de word spotting. La fusion permet d'améliorer les performances de la recherche. Les résultats montrent que pour des textes ayant un taux d'erreur au niveau mot inférieur à 23 %, les performances après fusion sont comparables à celles obtenues avec la vérité terrain. De plus, pour des textes fortement dégradés, des améliorations sont également observées

    Apprentissage de relations spatiales pour la reconnaissance d'expressions mathématiques manuscrites en-ligne

    Get PDF
    International audienceNous proposons dans cet article une nouvelle méthode d'analyse syntaxique et structurelle pour un système de reconnaissance d'expressions mathématiques manuscrites enligne. Une grammaire probabiliste est mise en place pour regrouper les hypothèses de segmentation/reconnaissance proposées par un segmenteur 2D. Les probabilités associés à la grammaire sont calculées à partir d'informations structurelles entre les symboles. Ces informations structurelles utilisent l'évaluation d'une relation spatiale entre les éléments intervenants dans chaque règle. L'apprentissage du système se fait en deux phases, d'abord l'apprentissage global du classifieur sans tenir compte de la grammaire, puis l'apprentissage des relations spatiales intervenant dans la grammaire. Ce système est entraîné et testé sur une large base synthétisée d'expressions, puis testé sur une base d'expressions réelles complexes

    Convertisseur d'équations LATEX2Ink

    Get PDF
    International audienceDans cet article nous présentons un outil de génération de formules mathématiques manuscrites en ligne à partir d'une chaîne LATEX. Ce générateur permettra facilement de fabriquer à partir d'un corpus de référence d'expressions mathématiques une base de données qui sera annotée automatiquement au niveau symbole. Ainsi, à partir d'une base de symboles isolés, nous pouvons produire de façon pseudo-synthétique une formule mathématique quelconque par un placement et un dimensionnement stochastiques 2D de ces éléments. Nous montrons l'intérêt de cet outil dans le cadre d'un projet visant à la conception d'une méthode adaptée à la reconnaissance et à l'interprétation d'expressions mathématiques en-ligne
    • …
    corecore