5 research outputs found

    La numérisation de documents : principes et évaluation des performances

    Get PDF
    Article dans revue scientifique avec comité de lecture.National audienceLe but de cet article est d'initier à l'élaboration d'une plate-forme industrielle de numérisation de documents papier. Par plate-forme industrielle, nous entendons une architecture logicielle basée sur l'intégration générique des outils de reconnaissance de caractères du commerce (OCR). En effet, l'évolution aujourd'hui de ces outils entrouvre une alternative sérieuse à la saisie manuelle dans un objectif de gain de productivité. Nous présenterons les capacités de ces outils et leurs limites. Nous nous attarderons sur les techniques d'évaluation automatiques de ces outils dans un triple objectif: (1) adaptation optimum des paramètres, (2) sélection du meilleur outil disponible à chaque instant à cause de l'évolution rapide du marché, (3) tirer un meilleur parti de ces outils en combinaison avec une double correction humaine. Enfin, nous ouvrirons l'architecture vers le futur en effleurant les techniques de combinaison pour augmenter la performance globale du système

    Reconnaissance de caractères : évaluation des performances

    Get PDF
    National audienceLa numérisation de documents est une étape importante dans la mise en place d'un système de gestion électronique de documents (GED). Le choix de la solution de numérisation doit prendre en compte toutes les étapes de traitement des documents depuis l'acquisition, la conversion du contenu (texte et structure) jusqu'à la correction et la mise en exploitation du document final. Le but de cette numérisation est une utilisation du contenu converti, par exemple pour effectuer une recherche d'information

    Arabic Handwriting: Analysis and Synthesis

    Get PDF
    corecore