1 research outputs found

    Apprentissage et reconnaissance automatique de types de formulaires par une méthode statistique

    Get PDF
    Cet article présente une méthode statistique de reconnaissance automatique des types de formulaires imprimés, comportant des champs manuscrits. Les blocs principaux rectangulaires qui définissent la structure physique du formulaire, sont fournis par un algorithme de segmentation automatique. La difficulté réside dans le fait que, pour plusieurs échantillons d'un même modèle, les blocs obtenus ne sont pas forcément stables (phénomène de fusionnement et/ou de fragmentation de blocs). Lors de la phase d'apprentissage, la probabilité d'occurrence de chaque bloc est comptabilisée. Dans la phase d'identification, nous tenons compte de cette probabilité. Une nouvelle distance, que nous avons appelée distance statistique pondérée, conçue spécialement pour résoudre ce problème d'instabilité, est inspirée de la distance de Mahalanobis, mais elle est enrichie par une pondération de pénalisation affectée à chaque bloc. La méthode a été appliquée à une base d'apprentissage, et de test d'une cinquantaine de classes, avec 20 échantillons par classe
    corecore