6 research outputs found

    Une approche générique de la modélisation spatiale et temporelle : application à la modélisation des paysages

    Full text link
    Les sciences qui traitent de la réalité, qu'elles soient naturelles, de la société ou de la vie, fonctionnent avec des modèles. Une partie de ces modèles décrivent les relations entre certaines grandeurs mesurables de la réalité, sans aller jusqu'au détail des interactions entre les éléments qui la composent. D'autres modèles décrivent ces interactions en prenant le point de vue des individus qui constituent le système, le comportement global n'est alors plus décrit à priori, mais observé à posteriori. Nous faisons le constat que dans les deux cas le scientifique a peu de liberté pour d'écrire les structures, en particulier spatiales, susceptibles de porter ces interactions. Nous proposons une approche de modélisation que l'on peut situer à mi-chemin entre les deux, et qui incite à étudier un système à travers la nature de ses interactions et des structures de graphes qui peuvent les porter. En plaçant au même niveau les relations spatiales, fonctionnelles, sociales ou hiérarchiques, nous tentons aussi de nous affranchir des contraintes induites par le choix effectué souvent à priori d'une forme de représentation de l'espace. Nous avons formalisé les concepts de base de cette approche, et ceux-ci ont constitué les éléments d'un langage métier, nommé Ocelet, que nous avons défini. Les outils permettant la mise en oeuvre de ce langage ont été développés et intégrés sous la forme d'un environnement de modélisation et de simulation. Enfin nous avons pu expérimenter notre nouvelle approche de modélisation et le langage Ocelet à travers la réalisation de plusieurs modèles présentant des situations variées de dynamiques paysagères. (Résumé d'auteur

    Maîtrise de la qualité des transcriptions numériques dans les projets de numérisation de masse

    Get PDF
    This work focuses on the assessment of characters recognition results produced automatically by optical character recognition software (OCR on mass digitization projects. The goal is to design a global control system robust enough to deal with BnF documents collection. This collection includes old documents which are difficult to be treated by OCR. We designed a word detection system to detect missed words defects in OCR results, and a words recognition rate estimator to assess the quality of word recognition results performed by OCR.We create two kinds of descriptors to characterize OCR outputs. Image descriptors to characterize page segmentation results and cross alignment descriptors to characterize the quality of word recognition results. Furthermore, we adapt our learning process to make an adaptive decision or prediction systems. We evaluated our control systems on real images selected randomly from BnF collection. The mmissed word detection system detects 84.15% of words omitted by the OCR with a precision of 94.73%. The experiments performed also showed that 80% of the documents of word recognition rate less than 98% are detected with an accuracy of 92%. It can also automatically detect 45% of the material having a recognition rate less than 70% with greater than 92% accuracy.Ce travail s’intéresse au contrôle des résultats de transcriptions numériques produites automatiquement par des logiciels de reconnaissance optique de caractères (OCR), lors de la réalisation de projets de numérisation de masse de documents. Le but de nos travaux est de concevoir un système de contrôle des résultats d’OCR suffisamment robuste pour être performant sur l’ensemble des documents numérisés à la BnF. Cettecollection est composée de documents anciens dont les particularités les rendent difficiles à traiter par les OCR, même les plus performants. Nous avons conçu un système de détection des mots omis dans les transcriptions, ainsi qu’une méthode d’estimation des taux dereconnaissance des caractères. Le contexte applicatif exclu de recourir à une vérité terrain pour évaluer les performances. Nous essayons donc de les prédire. Pour cela nous proposons différents descripteurs qui permettent de caractériser les résultats des transcriptions. Cette caractérisation intervient à deux niveaux. Elle permet d’une part de caractériser la segmentation des documents à l’aide de descripteurs de textures, et d’autres part de caractériser les textes produits en ayant recours à un second OCR qui joue le rôle d’une référence relative. Dans les deux cas, les descripteurs choisis permettent de s’adapter aux propriétés des corpus à contrôler. L’adaptation est également assurée par une étape d’apprentissage des étages de décision ou de prédiction qui interviennent dans le système. Nous avons évalué nos systèmes de contrôle sur des bases d’images réelles sélectionnées dans les collections documentaires de la BnF. Le système détecte 84, 15% des mots omis par l’OCR avec une précision de 94, 73%. Les expérimentations réalisées ont également permis de montrer que 80% des documents présentant un taux de reconnaissance mots inférieur à 98% sont détectés avec une précision de 92%. On peut également détecter automatiquement 45% des documents présentant un taux de reconnaissance inférieur à 70% avec une précision supérieure à 92%

    DE LA MODELISATION A L'EXPLOITATION DES DOCUMENTS A STRUCTURES MULTIPLES

    Get PDF
    With the recent development of new information and communication technologies, the paper documents are transformed to digital documents. Furthermore, it considers that the document is no longer seen as a whole, or as a monolithic bloc, but as organized entities. Exploiting these documents amount to identify and locate these entities. These entities are connected by relationships to give a "form" to document. Several types of relationships may occur, so that several "forms" of a document emerge. These different materializations of the same document are related to different uses of the same document and are essential for optimal management and shared of holdings. The work presented in this thesis aims to address the challenges of representing different materializations of a document through its representation of entities and their relationships. If those materializations are translated through structures, the issues are related to the representation of multistructured documents. Our work focuses mainly on the modeling, integration and exploitation of multistructured documents: (1) Proposal of multistructured document model. This model incorporates two levels of description: a specific level to describe each document through entities that compose and a generic level to identify document kinds through the grouping of similar structures. (2) Proposal of techniques for extracting structure (implicit or explicit) of a document (the specific level) and classification of this structure with respect to common structures (the generic level). The classification algorithm proposed includes a calculation of distance called "structural" (comparison of trees and graphs). This classification is associated with a process of verification of the "cohesion" of classes and possible reorganization of disrupted classes. (3) Proposal of document exploitation technical from their structures and their contents: (a) a document search that can reproduce documentary granules through criteria based on research of structures and / or content, (b) a multidimensional analysis that is to analyze and visualize the documentary information across multiple dimensions (of structures and / or content). In order to validate our proposals, we have developed a tool for integration and analysis of multistructured documents, called MDOCREP (Multistructured Document Repository). This tool provides on the one hand, the extraction and classification of document structures, and on the other hand, the querying and the multidimensional analysis of documents from their different structures.Avec l'évolution des nouvelles technologies de l'information et de la communication, les documents papier ont laissé la place aux documents numériques. On considère de plus que le document n'est plus vu comme un tout, ni comme un bloc monolithique, mais comme un ensemble organisé d'entités. Exploiter ces documents revient à identifier et retrouver ces entités. Ces dernières sont reliées par des relations permettant de donner une « forme » au document. Plusieurs types de relations peuvent apparaître, de sorte à ce que plusieurs « formes » d'un même document émergent. Ces différentes matérialisations d'un même document sont liées à des usages différents d'un même document et sont primordiales pour une gestion optimale et partagée des fonds documentaires. Les travaux présentés dans cette thèse visent à faire face aux défis de représentation des différentes matérialisations d'un document au travers de la représentation de ses entités et de leurs relations. Si ces matérialisations sont traduites par des structures, les enjeux concernent la représentation des documents à structures multiples. Nos travaux portent essentiellement sur la modélisation, l'intégration et l'exploitation des documents à structures multiples : (1) Proposition d'un modèle de documents multistructurés. Ce modèle intègre deux niveaux de description : un niveau spécifique permettant de décrire chaque document au travers des entités qui le composent et un niveau générique permettant de définir des typologies de documents au travers du regroupement de structures similaires. (2) Proposition des techniques d'extraction de structure (implicite ou explicite) d'un document (niveau spécifique) et de classification de cette structure par rapport à des structures communes (niveau générique). L'algorithme de classification proposé intègre un calcul d'une distance dite « structurelle » (comparaison d'arbres et de graphes). Cette démarche de classification est associée à une démarche de vérification de la « cohésion » des classes et de réorganisation éventuelle des classes perturbées. (3) Proposition de techniques d'exploitation des documents à partir de leurs structures et de leur contenu : (a) une recherche de documents qui permet de restituer des granules documentaires selon des critères de recherches basés sur la ou les structures et/ou le contenu ; (b) une analyse multidimensionnelle qui consiste à analyser et visualiser les informations documentaires selon plusieurs dimensions (de structures et/ou de contenu). Pour valider nos propositions, nous avons développé un outil d'aide à l'intégration et à l'analyse de documents à structures multiples, intitulé MDOCREP (Multistructured DOCument REPository). Cet outil assure d'une part, l'extraction et la classification des structures de documents, et d'autre part, l'interrogation et la restitution multidimensionnelle des documents à partir de leurs différentes structures

    Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018

    Get PDF
    International audienc

    Une archéologie de la logique du sens : arithmétique et contenu dans le processus de mathématisation de la logique au XIXe siècle

    Get PDF
    This work aims at providing a new general interpretation of the logic that was born with the work of Gottlob Frege, in order to make explicit one of the most decisive conditions of contemporary philosophy: the one that concerns the relation of philosophy to formal practices and knowledge. Its initial hypothesis states that Frege’s primary and most constant project was that of building a logic of content. However, the intelligibility thus gained does not intend to unearth a new underlying unity of Frege’s thought; it rather aims at localising the real gaps within Frege’s formulations that have not been identified as such until now. Still, those gaps do not require to be filled, for Frege’s logic is indeed effective despite this indeterminacy. Rather than the gaps, it is this ungrounded effectiveness that needs to be explained. Our answer to this question is that the effectiveness of Frege’s logic as a logic of content comes from a certain relationship with Arithmetic; in fact, Frege’s logic is constructed on the template of Arithmetic, before it becomes capable of constructing Arithmetic in turn. The task then arises to characterise precisely, at this constitutive and non-foundational level, the nature of the relation between a logic of content as a specific form of logic in the framework of its mathematization, and Arithmetic as a particular mathematical domain. From the meticulous study of the constitution of the Fregean system, an idea can be drawn that constitutes the central argument of this thesis: the various mathematical or formalised logical systems rest upon mathematics only through an intermediary dimension consisting in the practice, the reflection and the elaboration of signs, where the circulations between these two contemporary domains of formal knowledge (mathematics and logic) are constructed and justified. From this point of view, we then lay out a detailed study of the rise of the two most significant projects for formalizing logic in the nineteenth century: Frege’s and Boole’s (and the Booleans’). In the space leading from mathematical practices to logical systematisations through semiotic functioning, two general schemes or semiotic formal regimes can be drawn: “Symbolic Abstraction”, leading from abstract Algebra to Boolean propositional logic; and “Expressionism”, leading from Arithmetic to Predicate Calculus, associated to Frege’s work. More deeply, our research reveals a deep connexion between logical content and Arithmetic (understood as the theory of integers), which horizontally crosses the different semiotic regimes. Following the multiple dimensions of this nexus – which is responsible for the introduction of the category of sense in the framework of mathematized logic – a formal theory of expression can be drawn, which defines the conditions for the actual development of a logic of sense.Ce travail s’engage dans la reconstitution d’une intelligibilité globale nouvelle pour la logique qui est née avec Frege afin de restituer l’une des conditions décisives pour la philosophie contemporaine, à savoir celle qui concerne son rapport aux pratiques et aux savoirs formels. Son hypothèse initiale affirme que le projet premier et constant de Frege a été celui d’une logique du contenu. Pourtant, il ne s’agit pas de réinvestir l’œuvre de Frege d’une cohérence nouvelle dans le but de rétablir une unité stable. Car l’intelligibilité procurée par cette reconstitution permet de localiser dans les formulations de Frege de véritables lacunes qui ne semblent pas avoir été identifiées comme telles jusqu’ici. Que la logique de Frege soit efficace malgré ces lacunes, voilà ce qu’il faut expliquer. La réponse que nous donnons à ces questions est que l’efficacité de la logique de Frege en tant que logique du contenu provient d’un certain rapport à l’Arithmétique, à savoir celui par lequel c’est la logique qui est construite d’après les principes de l’Arithmétique, avant qu’elle ne soit capable de la construire à son tour. La question se pose alors de caractériser avec précision à ce niveau constitutif, non « fondationnel », la nature du rapport entre une logique du contenu comme forme spécifique de la logique dans le cadre de sa mathématisation, et l’Arithmétique comme domaine mathématique particulier. De l’analyse minutieuse de la constitution du système logique frégéen, une idée se dégage qui constitue la thèse centrale de notre travail : les différents systèmes de la logique mathématisée ou formelle ne reposent sur les mathématiques que par l’intermédiaire d’une dimension d’exercice, de réflexion et d’élaboration de signes, où les circulations et les emprunts entre ces deux savoirs formels contemporains que sont les mathématiques et la logique se construisent et se justifient. C’est donc cette thèse qu’il s’agit de démontrer, par une étude détaillée des processus d’émergence des deux plus grands projets de formalisation de la logique du XIXe siècle : celui de Frege et celui de Boole et des Booléens. Dans cet espace qui mène des pratiques mathématiques aux systématisations logiques à travers les fonctionnements des signes, deux régimes généraux se dessinent : celui d’ « Abstraction symbolique » qui mène de l’Algèbre abstraite à la Logique propositionnelle booléenne ; et celui de l’ « Expressionnisme », qui mène de l’Arithmétique au Calcul logique des prédicats, associée aux travaux de Frege. Mais plus profondément, par l’effet d’une lecture symptomale au plus près des dynamiques internes à ces processus, le présent travail décèle un lien transversal entre le contenu logique d’une part et l’Arithmétique comme ensemble des déterminations du nombre de l’autre. En suivant ce lien, qui s’avère le responsable de l’introduction de la catégorie de sens dans le cadre de la logique mathématisée, une théorie de l’expression formelle se dessine, définissant les conditions pour le développement d’une logique du sens

    Actes de l'Ecole d'Eté Temps Réel 2005 - ETR'2005

    Get PDF
    Pdf des actes disponible à l'URL http://etr05.loria.fr/Le programme de l'Ecole d'été Temps Réel 2005 est construit autour d'exposés de synthèse donnés par des spécialistes du monde industriel et universitaire qui permettront aux participants de l'ETR, et notamment aux doctorants, de se forger une culture scientifique dans le domaine. Cette quatrième édition est centrée autour des grands thèmes d'importance dans la conception des systèmes temps réel : Langages et techniques de description d'architectures, Validation, test et preuve par des approches déterministes et stochastiques, Ordonnancement et systèmes d'exploitation temps réel, Répartition, réseaux temps réel et qualité de service
    corecore