13 research outputs found

    Apprentissage dynamique du nombre d'états d'un modÚle de markov caché à observations continues : Application au tri de formulaires

    Get PDF
    Dans le cadre de la reconnaissance automatique de types de formulaires avec champs manuscrits et sans aucun signe de référence, basée sur une description de la structure physique du formulaire, nous sommes amenés à représenter un formulaire par un modÚle de Markov caché pseudo-2D (PHMM). Ce modÚle est constitué d'un graphe de super-états. A chaque super-état on associe un modÚle de Markov caché secondaire (HMM) dont les observations sont continues. Nous exposons pourquoi la méthode classique des k-moyennes est mal adaptée à notre problÚme, puis nous détaillons une nouvelle méthode générale qui prend mieux en compte la réalité physique des états, en les situant dans l'espace de représentation des caractéristiques, et en les construisant dynamiquement par agrégation progressive des séquences d'observations. Ce n'est qu'à la fin du processus d'agrégation que le nombre d'états du modÚle stochastique initial est connu

    Text Line Segmentation of Historical Documents: a Survey

    Full text link
    There is a huge amount of historical documents in libraries and in various National Archives that have not been exploited electronically. Although automatic reading of complete pages remains, in most cases, a long-term objective, tasks such as word spotting, text/image alignment, authentication and extraction of specific fields are in use today. For all these tasks, a major step is document segmentation into text lines. Because of the low quality and the complexity of these documents (background noise, artifacts due to aging, interfering lines),automatic text line segmentation remains an open research field. The objective of this paper is to present a survey of existing methods, developed during the last decade, and dedicated to documents of historical interest.Comment: 25 pages, submitted version, To appear in International Journal on Document Analysis and Recognition, On line version available at http://www.springerlink.com/content/k2813176280456k3

    Analyse fractale du lignage de l'écriture par la méthode du « block counting »

    Get PDF
    Classiquement, l'analyse fractale repose sur la propriété d'auto-similarité isotrope ou d'auto-affinité ; l'étalon de mesure est carré ou rectangulaire dans le cas 2D pour la méthode du box counting. Dans notre méthode, que nous appelons « block counting », l'étalon de mesure est un bloc rectangulaire dont seul un cÎté est soumis à l'homothétie, l'autre s'adaptant à la forme géométrique découpée dans la bande verticale. On en déduit un nouvel outil d'analyse fractale: le « block counting ». Cet outil est expérimenté sur des images de synthÚse puis sur des images réelles. Le « block counting » appliquée à l'analyse du lignage de l'écriture fournit deux caractéristiques nouvelles: la dimension fractale du « block counting » qui vaut 1 seulement lorsque les lignes sont séparables par projection horizontale, et la mesure de Hausdorff modifiée qui s'interprÚte comme la longueur du lignage. Ces deux paramÚtres ont été exploités avec succÚs pour la segmentation en lignes d'images de textes manuscrits arabes extraits de la bibliothÚque nationale tunisienne

    Utilisation de nouveaux paramĂštres Ă  base de fractale pour la discrimination des fontes arabes

    No full text
    La méthode présentée dans cet article permet l'identification des fontes arabes dans des images de textes imprimés. Cette méthode est basée sur l'utilisation de la géométrie fractale. Deux dimensions fractales sont extraites par la technique de comptage par boite et par celle de la dilatation élémentaire de l'image. Nous avons extrait trois paramÚtres pour chaque dimension fractale étudiée. Ces paramÚtres sont expérimentés dans les deux niveaux : ligne et bloc. Nous avons utilisé le KPPV pour classifier dix fontes. La discrimination est meilleure au niveau bloc. Pour évaluer l'aspect discriminatif de nos paramÚtres, nous avons utilisé une technique neuronale d'auto organisation en utilisant les six paramÚtres pour chaque prototype. Les résultats obtenus confirment la pertinence de notre méthode

    A Test of the ‘Tall-Dwarf” Hypothesis in Pearl Millet, Pennisetum glaucum (L.) R. Br.

    Get PDF
    Positive height-grain yield relationships exist for many cereals, but cannot be fully used in breeding because of lodging and harvestability problems in tall cultivars. Law et al. (1978) proposed a “tall-dwarf” hypothesis for wheat, in which the positive effects of minor height genes could be exploited by selecting for them in a major dwarfing gene background. The applicability of this hypothesis to pearl millet was tested by crossing a set of dwarf S1 progenies (from a single population) which varied in height onto two male-sterile lines. Mean (by S1 pollinator) hybrid grain yield was closely related to mean hybrid height (r2= 0.60) over a range of mean yields of 3.0–3.9 t ha−1 and a range of mean heights of 126–165 cm. The effect of height was expressed as an increase in grain number in one cross and as an increase in grain mass in the other, indicating the importance of background genetic effects on yield-height relationships in dwarf hybrids. The concept of “tall-dwarfs” appears to be applicable to pearl millet
    corecore