7 research outputs found

    Apprentissage progressif pour la reconnaissance de symboles dans les documents graphiques

    Get PDF
    National audienceLes méthodes actuelles de reconnaissance de symboles donnent de bons résultats quand il s'agit de reconnaître peu de symboles différents qui sont peu bruités et souvent déconnectés du graphique. Cependant, dans le cas d'applications réelles, les méthodes sont encore mal maîtrisées quand il s'agit de discriminer dans de grandes bases entre plusieurs centaines de symboles différents, souvent complexes et bruités et encapsulés dans les couches graphiques. Dans ce contexte il est nécessaire de mettre en oeuvre des méthodes d'apprentissage. Nous présentons dans cet article une méthode d'apprentissage progressif pour la reconnaissance de symboles qui améliore son propre taux de reconnaissance au fur et à mesure que de nouveaux symboles sont reconnus dans les documents. Pour ce faire, nous proposons une nouvelle exploitation de l'analyse discriminante qui fournit des règles d'affectation à partir d'un échantillon d'apprentissage sur lequel les appartenances aux classes sont connues (apprentissage supervisé). Mais cette méthode ne se révèle efficace que si l'échantillon d'apprentissage et les données ultérieures sont observés dans les mêmes conditions. Or cette hypothèse est rarement vérifiée dans les conditions réelles. Pour pallier ce problème, nous avons adapté une approche récente d'analyse discriminante conditionnelle qui ajoute à chaque observation l'observation d'un vecteur aléatoire, représentatif des effets parasites observés dans l'analyse discriminante classique

    DTW-Radon-based Shape Descriptor for Pattern Recognition

    Get PDF
    International audienceIn this paper, we present a pattern recognition method that uses dynamic programming (DP) for the alignment of Radon features. The key characteristic of the method is to use dynamic time warping (DTW) to match corresponding pairs of the Radon features for all possible projections. Thanks to DTW, we avoid compressing the feature matrix into a single vector which would otherwise miss information. To reduce the possible number of matchings, we rely on a initial normalisation based on the pattern orientation. A comprehensive study is made using major state-of-the-art shape descriptors over several public datasets of shapes such as graphical symbols (both printed and hand-drawn), handwritten characters and footwear prints. In all tests, the method proves its generic behaviour by providing better recognition performance. Overall, we validate that our method is robust to deformed shape due to distortion, degradation and occlusion

    Graphics Recognition -- from Re-engineering to Retrieval

    Get PDF
    Invited talk. Colloque avec actes et comité de lecture. internationale.International audienceIn this paper, we discuss how the focus in document analysis, generally speaking, and in graphics recognition more specifically, has moved from re-engineering problems to indexing and information retrieval. After a review of ongoing work on these topics, we propose some challenges for the years to come

    Content-based matching of line-drawing images using the Hough transform

    No full text
    We intro duc two novel methods for cr tentbasedmatc hing of line-drawing images. The methods are based on the Hough transform (HT),whic h is used to extrac global line features in an image. The parameter spac of the HT is first thresholded in order to preserve only the mostsignificM t values. In the first method, a feature vecA7 isc:::EMI]2E by summing up the significi tc oe#c27 ts ineac hc:6MA of theacIK ulator matrix. In this way, only the angular information is used. This approac h enables simple implementation ofscKM7 translation, and rotation invariantmatc hing. ThesecKM variant alsoincIE2A positional information of the lines and gives a more representativedesc6I]2KE of the images. Therefore, itac hieves moreaceI:#2 imagematc hing at the ceI of more running time

    Facet-based Indexing of Multiple Artifacts - A Framework to Cope with Vague Search Requests in the Domain of Product Development

    Get PDF
    Durch den zunehmenden Einsatz von Informations- und Kommunikationstechnologien sowie den schnellen Technologiefortschritt steht die Entwicklung technischer Produkte vor immer neuen Herausforderungen. Dabei ist die Aufgabe der Produktentwicklung selbst als Problemlösungsprozess zu betrachten, in dem Lösungen mittels intensiver Informationsverarbeitung gefunden werden. Somit werden täglich unterschiedlichste Arten von Informationen erstellt, benötigt und verarbeitet, die primär in digitaler Form vorliegen. Diese werden in heterogenen Anwendungssystemen verwaltet, was eine Wiederverwendung bereits existierender Informationen erschwert. Damit beansprucht die Suche nach Informationen noch immer einen erheblichen Anteil der Entwicklungszeit. Zur Verbesserung der Informationsversorgung im Bereich der technischen Produktentwicklung wird ein interaktives Information Retrieval-System – das LFRP-Framework – vorgestellt. Dieses kombiniert die vier Basiskonzepte der multiplen Ebenen, der facettierten Suche, des Rankings und der parallelen Koordinaten, um hochkomplexe Informationsbedürfnisse zu befriedigen. Seine Realisierung erfordert neben einer geeigneten Suchoberfläche die Entwicklung einer Indexierungskomponente, welche die vorhandenen Informationen in eine für das LFRP-Framework rechnerverarbeitbare Form transformiert. Dieser als Indexierung bezeichnete Prozess stellt die Grundvoraussetzung für die Funktionsfähigkeit eines Suchsystems dar und liegt daher im Fokus der Betrachtung. Es wird ein Lösungsansatz vorgestellt, welcher eine Indexierung in Form facettenbasierter Suchkriterien ermöglicht und dabei nicht nur Informationen aus heterogenen Anwendungssystemen, sondern insbesondere aus entwicklungsspezifischen Dokumenten, wie CAD-Modellen, technischen Zeichnungen oder Stücklisten, berücksichtigt.Due to both the increasing use of information and communication technology as well as the fast technological progress the domain of product development has to face new challenges. Thereby, the task of developing products is a problem solving process itself and requires intensive information processing activities in order to find appropriate solutions. Thus, a variety of information is generated, needed and processed every day. Mostly available in digital form, this data is archived in heterogenous application systems. This makes it difficult to re-use already existing data. Consequently, a significant part of the development time is still affected by searching for information. In order to improve the supply of data and information in the domain of product development an interactive information retrieval system – the LFRP framework – is proposed. This framework combines four core concepts – multiple layers, facetted search, ranking, and parallel coordinates – to satisfy information needs of high complexity. Besides an appropriate search interface, realizing this framework necessitates an indexing component, too. This component is the prerequisite for operating a search system and therefore presents the main issue of this work. The proposed approach enables an indexing process by using facetted search criteria. For this purpose, data provided not only by heterogenous application systems but also by documents characteristic for the development of products such as CAD models, technical drawings, or bills of materials is considered
    corecore