1,348 research outputs found

    Classification dynamique d'un flux documentaire : une évaluation statique préalable de l'algorithme GERMEN.

    No full text
    International audienceData-stream clustering is an ever-expanding subdomain of knowledge extraction. Most of the past and present research effort aims at efficient scaling up for the huge data repositories. Our approach focuses on qualitative improvement, mainly for "weak signals" detection and precise tracking of topical evolutions in the framework of information watch - though scalability is intrinsically guaranteed in a possibly distributed implementation. Our GERMEN algorithm exhaustively picks up the whole set of density peaks of the data at time t, by identifying the local perturbations induced by the current document vector, such as changing cluster borders, or new/vanishing clusters. Optimality yields from the uniqueness 1) of the density landscape for any value of our zoom parameter, 2) of the cluster allocation operated by our border propagation rule. This results in a rigorous independence from the data presentation ranking or any initialization parameter. We present here as a first step the only assessment of a static view resulting from one year of the CNRS/INIST Pascal database in the field of geotechnics

    Segmentation non-supervisée d'images couleur par sur-segmentation Markovienne en régions et procédure de regroupement de régions par graphes pondérés

    Full text link
    Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

    Un compromis temps-espace pour la résolution de réseaux de contraintes par décomposition

    No full text
    http://www710.univ-lyon1.fr/~csolnonNous revenons ici sur une méthode de résolution de CSP par décomposition introduite dans [16] et qui est appelée Regroupement Cyclique. Alors que [16] se limitait à présenter uniquement les principes de la méthode, dans cette contribution, nous montrons comment celle-ci peut être rendue opérationnelle, notamment par une exploitation idoine des propriétés des sous-graphes triangulés. Dans un second temps, nous présentons des résultats formels qui démontrent que le Regroupement Cyclique réalise effectivement un compromis temps-espace en termes de complexités théoriques. Nous concluons cet article en présentant quelques résultats expérimentaux qui montrent que le Regroupement Cyclique peut être efficace en pratique

    Segmentation et classification de points 3D obtenus à partir de relevés laser terrestres : une approche par super-voxels

    Get PDF
    Session "Posters"National audienceUne méthode de classification de données 3D éparses obtenues à partir de relevés laser terrestres en environment urbain est présentée. Elle est fondée sur une technique de segmentation manipulant des super-voxels. Le nuage de points 3D est tout d'abord divisé en voxels caractérisés par plusieurs attributs. Ils deviennent des super-voxels qui sont liés entre eux pour former des objets par une méthode de chainage plutôt que par une croissance de régions classique. Ces objets sont ensuite classifiés à partir de modèles géométriques et des descripteurs locaux. Afin d'évaluer les résultats, une nouvelle métrique est introduite. Elle caractérise à la fois les résultats de la segmentation et de la classification. L'influence sur les résultats de classification de la taille du voxel et de l'incorporation des informations couleur RVB et intensité de réflectance dans le super-voxel est aussi analysé

    Contribution à la gestion des données géographiques : Modélisation et interrogation par croquis

    Get PDF
    The Geographic Information Systems (GIS) require special needs to manage their content because they handle data structures are complex and heterogeneous. Such data are often difficult to describe in conventional queries or predicates are based on attributes. The freehand sketches (sketch) is a form of presentation that day was used to visualize, share and save the graphic information. It seems to be easily adaptable to present and examine a flexible GIS dataLes Systèmes d'Information Géographiques (SIG) réclament des besoins particuliers de gestion de leur contenu, parce qu'ils manipulent des données dont les structures sont complexes et hétérogènes. Ces données sont souvent difficiles à décrire par des requêtes classiques ou des prédicats basés sur des attributs. Le croquis à main levée (sketch) est une veille forme de présentation qui a été employée pour visualiser, échanger et enregistrer l'information graphique. Il semble être ainsi facilement adaptable pour présenter et interroger d'une manière flexible les données des SI

    Carte auto-organisatrice pour graphes étiquetés.

    No full text
    National audienceDans de nombreux cas d'études concrets, l'analyse de données sur les graphes n'est pas limitée à la seule connaissance du graphe. Il est courant que des informations supplémentaires soient disponibles sur les sommets et que l'utilisateur souhaite combiner ces informations à la structure du graphe lui-même pour comprendre l'intégralité des données en sa possession. C'est ce problème que nous souhaitons aborder dans cet article, en nous focalisant sur une méthode de fouille de données qui combine classification (non supervisée) et visualisation : les cartes auto-organisatrices. Nous expliquons comment l'utilisation de méthodes à noyaux permet de combiner de manière efficace des informations de natures diverses (graphe, variables numériques, facteurs, variables textuelles...) pour décortiquer la structure des données et en offrir une représentation simplifiée. Notre approche est illustrée sur divers exemples : un premier exemple, sur des données simulées, permet de comprendre comment se comporte l'algorithme. Un second exemple illustre la méthode sur un graphe réel de plusieurs centaines de sommets, qui modélise un corpus de documents médiévaux

    Développement d'une grille hexagonale hiérarchique et d'algorithmes de clustering "géosémantique" pour l'analyse et la découverte de connaissances géo-spatiales

    Get PDF
    Dans le cadre du projet MUSCAMAGSJ ± Multi-scale multi-agent geo-simulation ¿, les simulations sont produites dans un environnement virtuel géographique (EV G) qui reflète la réalité géographique grâce à l'usage de données géoréférencées. Compte tenu des applications de mobilité urbaine visées dans ce projet et de la disponibilité des données, l'EVG a été représenté par une grille hexagonale. Cependant, bien qu' il réduise le biais directionnel lors de l'analyse spatiale, ce genre de grille présente un inconvénient important: il ne permet pas une représentation multi -échelle de l'environnement géographique. Dans le cadre de ce projet de maîtrise, nous proposons une autre solution à ce problème. En effet, nous proposons de partitionner l'environnement à l'aide de cellules dont la forme géométrique fondamentale est le triangle équilatéral. Ensuite, à partir de ces cellules, nous développons un algorithme pour créer des cellules hexagonales hiérarchiques selon un indexage conforme à l'approche column-ordering. Ensuite nous intégrons ces grilles dans une application de système d'information géographique que nous emichissons par des techniques d'intelligence artificielle afin de faciliter la découverte et l'interprétation des phénomènes urbains. En effet, nous avons considéré plus particulièrement les automates cellulaires et les techniques de clustering issues du data mining. Ainsi, nous avons exploré une technique de regroupement ±géo-sémantique¿ des cellules en nous basant sur un algorithme de clustering par fusion. Également, nous avons associé aux grilles hexagonales hiérarchiques des automates cellulaires afin d'obtenir un processus de regroupement automatique (auto-regroupement) qui puisse être utilisé pour l'analyse des données spatiales

    Extraction d'une architecture logicielle à base de composants depuis un système orienté objet. Une aproche par exploration

    Get PDF
    Software architecture modeling and representation are a main phase of the development process of complex systems. In fact, software architecture representation provides many advantages during all phases of software life cycle. Nevertheless, for many systems, like legacy or eroded ones, there is no available representation of their architectures. In order to benefit from this representation, we propose, in this thesis, an approach called ROMANTIC which focuses on recovering a component-based architecture from an existing object-oriented system. This recover is a balancing problem of competing constraints which aims at obtaining the best architecture that can be abstracted from a system. Consequently, the main idea of this approach is to propose a quasi-automatic process of architecture identification by formulating it as a search-based problem. The latter acts on the space composed of all possible architectures abstracting the object-oriented system and use the architectural semantic and quality to choose the best solution. The process uses the intentional system architecture by means of the documentation and the architect's recommendations.La modélisation et la représentation des architectures logicielles sont devenues une des phases principales du processus de développement des systèmes complexes. En effet, la représentation de l'architecture fournit de nombreux avantages pendant tout le cycle de vie du logiciel. Cependant, pour beaucoup de systèmes existants, aucune représentation fiable de leurs architectures n'est disponible. Afin de pallier cette absence, source de nombreuses difficultés principalement lors des phases de maintenance et d'évolution, nous proposons dans cette thèse une approche, appelée ROMANTIC, visant à extraire une architecture à base de composants à partir d'un système orienté objet existant. L'idée première de cette approche est de proposer un processus quasi-automatique d'identification d'architectures en formulant le problème comme un problème d'optimisation et en le résolvant au moyen de méta-heuristiques. Ces dernières explorent l'espace composé des architectures pouvant être abstraites du système en utilisant la sémantique et la qualité architecturale pour sélectionner les meilleures solutions. Le processus s'appuie également sur l'architecture intentionnelle du système, à travers l'utilisation de la documentation et des recommandations de l'architecte

    Contributions au tri automatique de documents et de courrier d'entreprises

    Get PDF
    Ce travail de thèse s inscrit dans le cadre du développement de systèmes de vision industrielle pour le tri automatique de documents et de courriers d entreprises. Les architectures existantes, dont nous avons balayé les spécificités dans les trois premiers chapitres de la thèse, présentent des faiblesses qui se traduisent par des erreurs de lecture et des rejets que l on impute encore trop souvent aux OCR. Or, les étapes responsables de ces rejets et de ces erreurs de lecture sont les premières à intervenir dans le processus. Nous avons ainsi choisi de porter notre contribution sur les aspects inhérents à la segmentation des images de courriers et la localisation de leurs régions d intérêt en investissant une nouvelle approche pyramidale de modélisation par coloration hiérarchique de graphes ; à ce jour, la coloration de graphes n a jamais été exploitée dans un tel contexte. Elle intervient dans notre contribution à toutes les étapes d analyse de la structure des documents ainsi que dans la prise de décision pour la reconnaissance (reconnaissance de la nature du document à traiter et reconnaissance du bloc adresse). Notre architecture a été conçue pour réaliser essentiellement les étapes d analyse de structures et de reconnaissance en garantissant une réelle coopération entres les différents modules d analyse et de décision. Elle s articule autour de trois grandes parties : une partie de segmentation bas niveau (binarisation et recherche de connexités), une partie d extraction de la structure physique par coloration hiérarchique de graphe et une partie de localisation de blocs adresse et de classification de documents. Les algorithmes impliqués dans le système ont été conçus pour leur rapidité d exécution (en adéquation avec les contraintes de temps réels), leur robustesse, et leur compatibilité. Les expérimentations réalisées dans ce contexte sont très encourageantes et offrent également de nouvelles perspectives à une plus grande diversité d images de documents.This thesis deals with the development of industrial vision systems for automatic business documents and mail sorting. These systems need very high processing time, accuracy and precision of results. The current systems are most of time made of sequential modules needing fast and efficient algorithms throughout the processing line: from low to high level stages of analysis and content recognition. The existing architectures that we have described in the three first chapters of the thesis have shown their weaknesses that are expressed by reading errors and OCR rejections. The modules that are responsible of these rejections and reading errors are mostly the first to occur in the processes of image segmentation and interest regions location. Indeed, theses two processes, involving each other, are fundamental for the system performances and the efficiency of the automatic sorting lines. In this thesis, we have chosen to focus on different sides of mail images segmentation and of relevant zones (as address block) location. We have chosen to develop a model based on a new pyramidal approach using a hierarchical graph coloring. As for now, graph coloring has never been exploited in such context. It has been introduced in our contribution at every stage of document layout analysis for the recognition and decision tasks (kind of document or address block recognition). The recognition stage is made about a training process with a unique model of graph b-coloring. Our architecture is basically designed to guarantee a good cooperation bewtween the different modules of decision and analysis for the layout analysis and the recognition stages. It is composed of three main sections: the low-level segmentation (binarisation and connected component labeling), the physical layout extraction by hierarchical graph coloring and the address block location and document sorting. The algorithms involved in the system have been designed for their execution speed (matching with real time constraints), their robustness, and their compatibility. The experimentations made in this context are very encouraging and lead to investigate a wider diversity of document images.VILLEURBANNE-DOC'INSA-Bib. elec. (692669901) / SudocSudocFranceF
    • …
    corecore