9 research outputs found
Une méthode de vectorisation de dessins techniques adaptée aux plans mécaniques
Cette méthode permet l'extraction des segments de droite d'une image numérisée qui peut aussi contenir des caractères et des symboles. On utilise la distance de propagation directionnelle dans le but de mesurer les longueurs et largeurs des éléments graphiques. La détection des pixels représentatifs de la forme est réalisée en utilisant des seuils adaptatifs de longueur et d'épaisseur. Le troisième traitement détermine les points de frontière de tous les groupes de pixels ainsi sélectionnés. Ceci a pour effet de casser les formes connexes. Tous les segments de droite ainsi répertoriés seront étiquetés. La méthode des moindres carrés permet de reconstituer les vecteurs. Une comparaison avec l'image initiale permet l'extension des segments
Apprentissage et reconnaissance automatique de types de formulaires par une méthode statistique
Cet article présente une méthode statistique de reconnaissance automatique des types de formulaires imprimés, comportant des champs manuscrits. Les blocs principaux rectangulaires qui définissent la structure physique du formulaire, sont fournis par un algorithme de segmentation automatique. La difficulté réside dans le fait que, pour plusieurs échantillons d'un même modèle, les blocs obtenus ne sont pas forcément stables (phénomène de fusionnement et/ou de fragmentation de blocs). Lors de la phase d'apprentissage, la probabilité d'occurrence de chaque bloc est comptabilisée. Dans la phase d'identification, nous tenons compte de cette probabilité. Une nouvelle distance, que nous avons appelée distance statistique pondérée, conçue spécialement pour résoudre ce problème d'instabilité, est inspirée de la distance de Mahalanobis, mais elle est enrichie par une pondération de pénalisation affectée à chaque bloc. La méthode a été appliquée à une base d'apprentissage, et de test d'une cinquantaine de classes, avec 20 échantillons par classe
Text Line Segmentation of Historical Documents: a Survey
There is a huge amount of historical documents in libraries and in various
National Archives that have not been exploited electronically. Although
automatic reading of complete pages remains, in most cases, a long-term
objective, tasks such as word spotting, text/image alignment, authentication
and extraction of specific fields are in use today. For all these tasks, a
major step is document segmentation into text lines. Because of the low quality
and the complexity of these documents (background noise, artifacts due to
aging, interfering lines),automatic text line segmentation remains an open
research field. The objective of this paper is to present a survey of existing
methods, developed during the last decade, and dedicated to documents of
historical interest.Comment: 25 pages, submitted version, To appear in International Journal on
Document Analysis and Recognition, On line version available at
http://www.springerlink.com/content/k2813176280456k3
VECTORISATION, SEGMENTATION DE SCHEMAS ELECTRONIQUES, ET RECONNAISSANCE DES COMPOSANTS
LE HAVRE-BU Centrale (763512101) / SudocSudocFranceF
Identification automatique de types de formulaires par des méthodes stochastiques markoviennes
LE HAVRE-BU Centrale (763512101) / SudocSudocFranceF
Influence des ondes circonferentielles sur la diffusion des ondes ultrasonores par des cylindres immerges dans l'eau
Dans ce travail, les auteurs étudient l'influence de deux types d'ondes circonférentielles sur le diagramme de diffusion du cylindre. Les premières qui se propagent dans le solide élastique sont des ondes de "Galerie à écho". Elles réémettent leur énergie progressivement dans le liquide. Cette faible atténuation permet la formation d'ondes stationnaires qui persistent après l'arrêt de l'excitation forcée. Ces ondes stationnaires provoquent une émission cohérente qu'il est possible de détecter dans l'eau. Les secondes qui se propagent dans le liquide sont les ondes de Franz. Elles diffusent rapidement leur énergie sous la forme d'ondes de volume dans le liquide, ce qui ne permet pas la formation d'ondes stationnaires donc de résonances. Pour étudier l'influence des ondes de Galerie à écho, la recherche systématique des résonances est faite avec possibilité de les séparer lorsqu'elles sont voisines. Une mesure de l'atténuation en fonction de la fréquence est proposée à partir du signal réémis dans le liquide après l'arrêt de l'excitation forcée. Les ondes de Franz au contraire sont générées tangentiellement à la surface par un train d'onde de courte durée. La célérité et l'atténuation sont mesurées en fonction de la fréquence
Classification des k-ppv par sous-voisinages emboîtés
La méthode des plus proches voisins est une méthode de classification géométrique très utilisée en reconnaissance de formes, en raison de sa simplicité et de sa robustesse. Les caractéristiques sont exploitées dans un espace métrique de représentation, généralement Rn muni de la distance euclidienne. La méthode de Keller repose sur une fonction de décision floue qui met en jeu les distances des protoypes au point inconnu. Nous proposons une nouvelle règle de décision floue dans laquelle la contribution d'un prototype ne se fait pas individuellement , mais collectivement, en considérant son sous-voisinage, selon la règle : un prototype est d'autant plus influent qu'il est plus proche du point inconnu, et qu'il existe des protoypes de la même classe plus proche que lui. Les essais de validation sont menés en comparaison notamment avec la méthode de Keller (avec initialisation nette) sur deux banques de données standard : la base des 150 iris de Fischer en auto-validation dans l'espace de représentaiont de dimension 4, et la base mnist de chiffres manuscrits composée d'une base d'apprentissage de 60 000 caractères et d'une base de test de 10 000 dans l'espace de représentation de dimension 28*28. Cependant, l'exemple de la base mnist montre que le gain reste faible, en comparaison des méthodes qui exploitent les invariances des prototypes par transformations géométriques ou par combinaison linéaire des voisins
Segmentation texte /graphique : Application au manuscrits Arabes Anciens
Cet article présente une nouvelle méthode de segmentation d'images de documents couleur de type manuscrits arabes anciens. La méthode développée opère directement sur la luminance. L'analyse multiéchelle permet une séparation entre le fond et l'avant plan. Des caractéristiques statistiques ont extraites de l'avant plan obtenue et sont utilisées par l'algorithme de classification c-moyen floue pour la segmentation texte/graphique de l'avant plan. Notre méthode a été testée sur 50 images de documents manuscrits rares, à structure complexe, extraits d'une base de 2000 manuscrits de la Bibliothèque Nationale Tunisienne. Les tests menés montrent des résultats satisfaisants pour la segmentation avant/arrière plan. La segmentation de l'avant plan en texte/graphique reste à améliorer
Méthode hybride de séparation Avant/arrière-plan pour la restauration des manuscrits arabes anciens couleur
International audienceCet article présente un système de segmentation hybride d'images de documents couleur de type manuscrits arabes anciens. La méthode consiste à coupler un algorithme de normalisation de l'intensité lumineuse de l'arrière-plan de l'image du document avec un algorithme de classification par K- moyennes pour la séparation Avant-plan/Arrière-plan. La méthode de normalisation permet une première séparation entre le fond et l'avant-plan ; seul ce dernier est exploité pour les traitements ultérieurs. Cette technique de séparation agit sur la luminance et altère le contraste. Ces déformations sont rectifiées par une correction gamma suivi d'un rehaussement du contraste. L'image d'avant-plan ainsi traitée est à nouveau segmentée en deux classes (avant-plan/arrière-plan) par l'algorithme de maximum de vraisemblance ayant comme extracteur de paramètres l'algorithme des kmoyennes. L'arrière-plan subit un lissage puis est combiné par superposition avec l'avant pour obtenir l'image restaurée du document. Notre méthode a été testée sur un échantillon de 100 images de documents extrait d'une base de 2000 manuscrits arabes anciens de la Bibliothèque Nationale Tunisienne. Elle a montré de bons résultats sur des images altérées par un effet de transparence (l'écriture du verso transparaît en filigrane au recto), par des tâches localisées et par un fond de couleur irrégulière