13 research outputs found
Apprentissage dynamique du nombre d'états d'un modÚle de markov caché à observations continues : Application au tri de formulaires
Dans le cadre de la reconnaissance automatique de types de formulaires avec champs manuscrits et sans aucun signe de référence, basée sur une description de la structure physique du formulaire, nous sommes amenés à représenter un formulaire par un modÚle de Markov caché pseudo-2D (PHMM). Ce modÚle est constitué d'un graphe de super-états. A chaque super-état on associe un modÚle de Markov caché secondaire (HMM) dont les observations sont continues. Nous exposons pourquoi la méthode classique des k-moyennes est mal adaptée à notre problÚme, puis nous détaillons une nouvelle méthode générale qui prend mieux en compte la réalité physique des états, en les situant dans l'espace de représentation des caractéristiques, et en les construisant dynamiquement par agrégation progressive des séquences d'observations. Ce n'est qu'à la fin du processus d'agrégation que le nombre d'états du modÚle stochastique initial est connu
Text Line Segmentation of Historical Documents: a Survey
There is a huge amount of historical documents in libraries and in various
National Archives that have not been exploited electronically. Although
automatic reading of complete pages remains, in most cases, a long-term
objective, tasks such as word spotting, text/image alignment, authentication
and extraction of specific fields are in use today. For all these tasks, a
major step is document segmentation into text lines. Because of the low quality
and the complexity of these documents (background noise, artifacts due to
aging, interfering lines),automatic text line segmentation remains an open
research field. The objective of this paper is to present a survey of existing
methods, developed during the last decade, and dedicated to documents of
historical interest.Comment: 25 pages, submitted version, To appear in International Journal on
Document Analysis and Recognition, On line version available at
http://www.springerlink.com/content/k2813176280456k3
Analyse fractale du lignage de l'écriture par la méthode du « block counting »
Classiquement, l'analyse fractale repose sur la propriété d'auto-similarité isotrope ou d'auto-affinité ; l'étalon de mesure est carré ou rectangulaire dans le cas 2D pour la méthode du box counting. Dans notre méthode, que nous appelons « block counting », l'étalon de mesure est un bloc rectangulaire dont seul un cÎté est soumis à l'homothétie, l'autre s'adaptant à la forme géométrique découpée dans la bande verticale. On en déduit un nouvel outil d'analyse fractale: le « block counting ». Cet outil est expérimenté sur des images de synthÚse puis sur des images réelles. Le « block counting » appliquée à l'analyse du lignage de l'écriture fournit deux caractéristiques nouvelles: la dimension fractale du « block counting » qui vaut 1 seulement lorsque les lignes sont séparables par projection horizontale, et la mesure de Hausdorff modifiée qui s'interprÚte comme la longueur du lignage. Ces deux paramÚtres ont été exploités avec succÚs pour la segmentation en lignes d'images de textes manuscrits arabes extraits de la bibliothÚque nationale tunisienne
Utilisation de nouveaux paramĂštres Ă base de fractale pour la discrimination des fontes arabes
La méthode présentée dans cet article permet l'identification des fontes arabes dans des images de textes imprimés. Cette méthode est basée sur l'utilisation de la géométrie fractale. Deux dimensions fractales sont extraites par la technique de comptage par boite et par celle de la dilatation élémentaire de l'image. Nous avons extrait trois paramÚtres pour chaque dimension fractale étudiée. Ces paramÚtres sont expérimentés dans les deux niveaux : ligne et bloc. Nous avons utilisé le KPPV pour classifier dix fontes. La discrimination est meilleure au niveau bloc. Pour évaluer l'aspect discriminatif de nos paramÚtres, nous avons utilisé une technique neuronale d'auto organisation en utilisant les six paramÚtres pour chaque prototype. Les résultats obtenus confirment la pertinence de notre méthode
A Test of the âTall-Dwarfâ Hypothesis in Pearl Millet, Pennisetum glaucum (L.) R. Br.
Positive height-grain yield relationships exist for many cereals, but cannot be fully used in breeding because of lodging and harvestability problems in tall cultivars. Law et al. (1978) proposed a âtall-dwarfâ hypothesis for wheat, in which the positive effects of minor height genes could be exploited by selecting for them in a major dwarfing gene background. The applicability of this hypothesis to pearl millet was tested by crossing a set of dwarf S1 progenies (from a single population) which varied in height onto two male-sterile lines. Mean (by S1 pollinator) hybrid grain yield was closely related to mean hybrid height (r2= 0.60) over a range of mean yields of 3.0â3.9 t haâ1 and a range of mean heights of 126â165 cm. The effect of height was expressed as an increase in grain number in one cross and as an increase in grain mass in the other, indicating the importance of background genetic effects on yield-height relationships in dwarf hybrids. The concept of âtall-dwarfsâ appears to be applicable to pearl millet