unknown

Information fusion and adaptation for on-line text recognition

Abstract

In this paper, we present a new writer independent system dedicated to the automatic recognition of on-line hand-printed texts. This system uses a very large French lexicon (200000 words), which covers numerous fields of application. The recognition process is based on the activation-verification model proposed in perceptive psychology. A set of experts encodes the input signal and extracts probabilistic information at several levels of abstraction (geometrical and morphological). A neural expert generates a tree of segmentation hypotheses. It is explored by a probabilistic fusion expert that uses all the available information (geometrical, morphological and lexical) in order to provide the best transcription of the input signal. We experiment several strategies of self-supervised writer-adaptation on this system. The best one, called “dynamic self-supervised adaptation”, modifies the recognizer parameters continuously. It gets recognition results close to supervised methods. These results are evaluated on a database of 90 texts (5400 words) written by 38 different writers and are very encouraging as they reach a recognition rate of 90%.Dans cet article nous présentons un nouveau système de reconnaissance de textes manuscrits scripts en mode omni-scripteur. Ce système utilise un lexique français de très grande taille (200 000 mots), qui couvre de nombreux champs d'application. Le processus de reconnaissance repose sur le modèle d'activationvérification proposé en psychologie perceptive. Un ensemble d'experts code le signal d'entrée et extrait des informations probabilistes à différents niveaux d'abstraction (géométrique, morphologique). Un expert de segmentation neuronal génère un treillis d’hypothèses qui est exploré par un expert de fusion probabiliste qui utilise toute l’information disponible (géométrique, morphologique et lexicale) afin de fournir la meilleure retranscription du signal d’entrée. Nous avons expérimenté plusieurs stratégies d'adaptation non supervisée au scripteur. La meilleure, appelée « adaptation non-supervisée dynamique» agit en continu sur les paramètres du système. Elle permet d'atteindre des performances proches de l’une adaptation supervisée. Les performances, évaluées sur une base de données comportant 90 textes (5 400 mots) écrits par 38 utilisateurs différents, sont très encourageantes car elles atteignent un taux de reconnaissance de 90%

    Similar works