83 research outputs found

    Modélisation informatique de structures dynamiques de segments textuels pour l'analyse de corpus

    No full text
    The objective of the thesis is to propose a data-processing model to represent, build and exploit textualstructures. The suggested model relies on a «type/token» form of text representation extended bysystems of lexical and contextual annotations. This model's establishment was carried out in the SATOsoftware -- of which the functionalities and the internal organization are presented. Reference to anumber of works give an account of the development and use of the software in various contexts.The formal assumption of the textual and discursive structures find an ally in the beaconing XMLlanguage and the proposals of the Text Encoding Initiative (TEI). Formally, the structures built on thetextual segments correspond to graphs. In a development driven textual analysis context, these graphsare multiple and partially deployed. Their resolution, within the fastening of the nodes to textualsegments or that of other graphs, is a dynamic process which can be sustained by various dataprocessingmechanisms. Examples drawn from textual linguistics are used to illustrate the principles ofstructural annotation. Prospective considerations for the data-processing establishment of amanagement system of the structural annotation are also exposed.L'objectif de la thĂšse est de proposer un modĂšle informatique pour reprĂ©senter, construire et exploiterdes structures textuelles. Le modĂšle proposĂ© s'appuie sur une reprĂ©sentation du texte sous la forme d'unplan lexique/occurrences augmentĂ© de systĂšmes d'annotations lexicales et contextuelles, modĂšle dontune implantation a Ă©tĂ© rĂ©alisĂ©e dans le logiciel SATO dont on prĂ©sente les fonctionnalitĂ©s etl'organisation interne. La prĂ©sentation d'un certain nombre de travaux rendent compte dudĂ©veloppement et de l'utilisation du logiciel dans divers contextes.La prise en charge formelle des structures textuelles et discursives trouve un alliĂ© dans le langage debalisage XML et dans les propositions de la Text Encoding Initiative (TEI). Formellement, lesstructures construites sur les segments textuels correspondent Ă  des graphes. Dans le contexte d'uneanalyse textuelle en Ă©laboration, ces graphes sont multiples et partiellement dĂ©ployĂ©s. La rĂ©solution deces graphes, au sens du rattachement des noeuds Ă  des segments textuels ou Ă  des noeuds d'autresgraphes, est un processus dynamique qui peut ĂȘtre soutenu par divers mĂ©canismes informatiques. Desexemples tirĂ©s de la linguistique textuelle servent Ă  illustrer les principes de l'annotation structurelle.Des considĂ©rations prospectives sur une implantation informatique d'un systĂšme de gestion del'annotation structurelle sont aussi exposĂ©es

    De nouveaux facteurs pour l'exploitation de la sémantique d'un texte en recherche d'information

    Get PDF
    Les travaux prĂ©sentĂ©s dans ce mĂ©moire se situent dans le contexte de la recherche d'information. Plus prĂ©cisĂ©ment, nous proposons de nouveaux facteurs " centralitĂ©, frĂ©quence conceptuelle" permettant Ă  notre sens, de mieux caractĂ©riser la dimension sĂ©mantique du contenu des textes, allant au-delĂ  des mĂ©thodes d'indexation classiques basĂ©es exclusivement sur les statistiques. Ces facteurs devraient tirer parti de l'identification de diffĂ©rents types de relations telles que -est-une partie-de, liĂ©s Ă , synonymie, domaine, etc.- qui existent entre les mots d'un texte. L'approche que nous avons proposĂ©e pour calculer la valeur de nos facteurs est bĂątie en trois Ă©tapes : (1) Extraction des concepts issus de WordNet1 associĂ©s aux termes du document puis dĂ©sambigĂŒisation de leurs sens, (2) Regroupement des concepts pour former des clusters de concepts (Ces Ă©tapes construisent la vue sĂ©mantique des documents), (3) A l'intĂ©rieur de chaque cluster, chaque terme possĂšde un degrĂ© de " centralitĂ© ", fonction du nombre de mots du cluster avec lequel il est en relation directe, et une " frĂ©quence conceptuelle " estimĂ©e par la somme des frĂ©quences de ces mots. D'une part, nous menons une Ă©tude sur des mĂ©thodes potentielles basĂ©es sur les facteurs proposĂ©s pour extraire des vues sĂ©mantiques du contenu des textes. L'objectif est de construire des structures de graphes/hiĂ©rarchies offrant une vue du contenu sĂ©mantique des documents. Ensuite, ces vues seront Ă©laborĂ©es Ă  partir de nos nouveaux facteurs, mais aussi de l'utilisation des frĂ©quences d'occurrence, et de la prise en compte de l'importance des mots (en particulier en terme de leur spĂ©cificitĂ©). Le poids relatif des vues partielles, la frĂ©quence et la spĂ©cificitĂ© de leurs composants sont d'autant des indications qui devraient permettre d'identifier et de construire des sous-ensembles hiĂ©rarchisĂ©s de mots (prĂ©sents dans le texte ou sĂ©mantiquement associĂ©s Ă  des mots du texte), et de reflĂ©ter les concepts prĂ©sents dans le contenu du texte. L'obtention d'une meilleure reprĂ©sentation du contenu sĂ©mantique des textes aidera Ă  mieux retrouver les textes pertinents pour une requĂȘte donnĂ©e, et Ă  donner une vue synthĂ©tisĂ©e du contenu des textes proposĂ©s Ă  l'utilisateur en rĂ©ponse Ă  sa requĂȘte. D'autre part, nous proposons une technique de dĂ©sambiguĂŻsation du concept basĂ©e sur la centralitĂ©. En fait, le sens d'un terme est ambigu, il dĂ©pend de son contexte d'emploi. Dans notre proposition, nous utilisons l'ontologie de WordNet, qui est prĂ©cise dans la couverture des sens de termes, oĂč un terme peut ĂȘtre attachĂ© Ă  plusieurs concepts. La mĂ©thode proposĂ©e consiste Ă  trouver le meilleur concept WordNet permettant de reprĂ©senter le sens du terme dĂ©signĂ© par le texte. Le concept choisi est celui qui a un maximum de relations avec les termes du document, autrement dit, celui qui a une valeur maximale de centralitĂ©. L'utilisation d'une mĂ©thode de dĂ©sambiguĂŻsation est une Ă©tape inĂ©vitable dans une indexation conceptuelle, elle permet de mieux reprĂ©senter le contenu sĂ©mantique d'un document. Enfin, nous utilisons nos facteurs dans le cadre de Recherche d'Information comme de nouveaux facteurs pour mesurer la pertinence d'un document vis-Ă -vis d'une requĂȘte (tĂąche de RI ad-hoc). L'utilisation de nos facteurs sĂ©mantiques est intĂ©ressante dans la RI, oĂč nous estimons un degrĂ© de relativitĂ© entre les termes d'une requĂȘte et ceux d'un document indĂ©pendamment de leur prĂ©sence dans ce dernier. Dans ce cadre, nous avons proposĂ© une nouvelle fonction de pondĂ©ration basĂ©e sur la centralitĂ©, ainsi que nous avons intĂ©grĂ© les nouveaux facteurs Ă  des fonctions connues. Dans les diffĂ©rentes expĂ©rimentations menĂ©es, nous avons montrĂ© que l'intĂ©gration de nos facteurs sĂ©mantiques ramĂšne une amĂ©lioration au niveau de prĂ©cision dans un moteur de recherche d'information. TĂąche prometteuse pour une recherche plus ciblĂ©e et plus efficace.The work presented in this paper are in the context of information retrieval. Specifically, we propose new factors "centrality frequebcy conceptual" to our senses, to better characterize the semantic dimension of the text content, going beyond traditional indexing methods based solely on statistics. Theses factors should benefit from the identification of different typesif relationships sich as is-part-of, relating to, synonymy, domain, etc. -between tha words of text

    Numérique : impact sur le cycle de vie du document (Le)

    Get PDF
    Actes du colloque "Le numérique : impact sur le cycle de vie du document" organisé à l\u27université de Montréal par l\u27EBSI et l\u27ENSSIB du 13 au 15 octobre 2004. Son objectif était de traiter de façon interdisciplinaire la problématique suivante : « La numérisation, la diffusion des formats numériques originaux, les nouvelles méthodes d\u27indexation et d\u27analyse du document ainsi que le fonctionnement en réseau changent les données de base de la vie du document qui devient une sorte de phénix incessamment renaissant » (programme du colloque)

    RECONNAISSANCE DE FORMES APPLIQUEE A L’ECRITURE ARABEMANUSCRITE PAR DES MULTICLASSIFIEURS

    Get PDF
    Le prĂ©sent travail porte sur une Ă©tude concernant le domaine de reconnaissance de formes appliquĂ© sur l’écriture arabe manuscrite par des multiclassifieurs, D’abords il s’agit de faire une Ă©tude gĂ©nĂ©rale sur la reconnaissance de formes, puis de faire une Ă©tude bibliographique sur les systĂšmes existants et les diffĂ©rentes recherches effectuĂ©es sur ce domaine, ensuite de faire une Ă©tude sur les caractĂ©ristiques morphologiques et structurelles de l’écriture Arabe, puis Ă©tudier les systĂšmes de classification couramment utilisĂ©s, ainsi que des concepts de bases des combinaisons parallĂšles des classifieurs. Pour enfin proposer un systĂšme multiclassifieur de reconnaissance de mots arabes dans un lexique dĂ©fini

    Effets de privations sélectives en sommeil lent et en sommeil paradoxal sur l'attention automatique et sélective

    Full text link
    Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

    Effet du microclimat sur l'initiation de la corrosion des aciers d'armature dans les ouvrages en béton armé

    Get PDF
    The deterioration of reinforced concrete structures and the associated rehabilitation work represent an economic cost of premier importance. In Switzerland, the structural maintenance expenditures amount to 40% to 65% of the initial construction cost (over a 100 year life-span). Among the maintenance and rehabilitation activities, those dedicated to combating corrosion constitute the largest portion of invested financial resources. For example, the curbs of each highway bridge need to be repaired every 20 to 30 years, resulting in extensive maintenance and user costs. The corrosion phenomenon is initiated by the presence of oxygen and water acting upon steel reinforcement with a compromised protective oxide film (a natural protective layer surrounding the steel). This protective layer is eliminated by carbonization of the concrete (the reaction between carbondioxide and concrete calcium-hydroxide paste), a sufficient chloride ion concentration around the steel reinforcement (introduced by the spreading of de-icing salts on the roads during winter), or a combination of the two phenomena. The water diffusion in the concrete cover facilitates the chloride ion movement, reducing the corrosion initiation time, and likewise, increasing deterioration rate. This research proposes a model, "TransChlor," to evaluate the duration of the corrosion initiation processes. TransChlor can therefore serve as a decision aid during the structural maintenance plan selection process and during the design of new structural elements to mitigate the steel reinforcement corrosion problem. The model can also complement and elaborate upon the existing codes. TransChlor is based on a structural analysis approach that groups the elements of a structure into distinct groups. Each group is defined by similar functional and structural qualities influencing the corrosion phenomenon (concrete cover permeability, degree of exposure to aggressive corrosive agents, local defects). The model in particular distinguishes the elements exposed to mist and liquid water. This model is based on in-situ measurements (structural monitoring) and inspections performed by trained inspectors. TransChlor employs a deterministic approach to simulate water diffusion, chloride ion diffusion, gas penetration, and thermal conduction. The penetration of liquid water into the concrete pours, called capillary suction, was experimentally studied in the laboratory at low temperatures to match in-situ conditions. These experiments formed the calibration base of this model. TransChlor also incorporates a probabilistic model to consider the variable and indeterminate aspects of the corrosion problem, such as the permeability space, the concrete cover thickness, and the reinforcing steel physical-chemical resistance to chloride ion attack. The deterministic model is refined by the probabilistic approach and together TransChlor offers a more exact evaluation of the corrosion deterioration risks and can facilitate the objective dialogue and discussion between owners and maintenance specialists. For locations exposed to liquid water and brine, the standards should impose additional protective provisions such as periodic hydrophobic impregnations, implementation of stainless steel reinforcing bars, etc. For other locations (exposed to salt spay and carbonated concrete not exposed to chloride ions), the codes should require complementary construction and maintenance provisions

    Méthodes de vision et d'intelligence artificielles pour la reconnaissance de spécimens coralliens

    Get PDF
    Ce mĂ©moire traite de l'automatisation de l'extraction de donnĂ©es nĂ©cessaires Ă  la caractĂ©risation de la biodiversitĂ© d’espĂšces benthiques, une problĂ©matique environnementale d’actualitĂ©. L'impact des activitĂ©s humaines sur la faune marine est une prĂ©occupation grandissante. Les eaux des Philippines, qualifiĂ©es par plusieurs Ă©cologistes comme Ă©tant le « berceau de la biodiversitĂ© marine », sont comme tant d’autres sous la menace constante des changements climatiques, de la pĂȘche invasive et de la pollution cĂŽtiĂšre. Notre sujet d'intĂ©rĂȘt, les rĂ©cifs coralliens, sont une des principales victimes de ces perturbations humaines. Le phĂ©nomĂšne est largement reconnu, mais malheureusement aucune Ă©valuation quantitative des dommages causĂ©s Ă  la biodiversitĂ© ne peut ĂȘtre obtenue facilement. Les Ă©cologistes ont besoin d'outils, permettant de traiter en lot les donnĂ©es recueillies sur le terrain pour conclure sur le vĂ©ritable impact de l'homme sur cet Ă©cosystĂšme fragile. Dans ce contexte, le but de l’étude est de fournir une implĂ©mentation logicielle capable d’automatiser la dĂ©tection et l’identification de spĂ©cimens coralliens dans une banque de photographies sous-marines. Pour ce faire, deux approches distinctes ont Ă©tĂ© mises Ă  l’essai : l’identification des coraux en fonction de leur forme de croissance (la reprĂ©sentation par formes benthiques) et l’identification prĂ©cise de l’espĂšce des spĂ©cimens (la reprĂ©sentation taxinomique). Pour l’identification par formes benthiques, divers outils de vision artificielle, tels les descripteurs issus des matrices de cooccurrence des tons de gris (GLCM), des motifs binaires locaux (LBP), de l’histogramme des tons et de la transformĂ©e de Fourier ont Ă©tĂ© mis Ă  l’essai. Ces descripteurs ont Ă©tĂ© utilisĂ©s conjointement Ă  divers algorithmes de reconnaissance de formes tels le classificateur bayesien, la mĂ©thode des plus proches voisins, l’arbre de classification C4.5, le sĂ©parateur Ă  vaste marge (SVM) et le perceptron multicouches qui ont Ă©tĂ© comparĂ©s dans ce contexte de classification par formes benthiques. Dans un deuxiĂšme temps, l’expĂ©rimentation a Ă©tĂ© reprise sur le problĂšme de classification taxinomique. Au cours de cette Ă©tude, la problĂ©matique de segmentation automatisĂ©e des spĂ©cimens de corail a Ă©tĂ© abordĂ©e. Une prĂ©segmentation par laplacien du gaussien et partage des eaux, suivie d’une classification des segments avec un SVM optimisĂ©, utilisant les descripteurs dĂ©veloppĂ©s prĂ©cĂ©demment, se sont avĂ©rĂ©es une solution efficace Ă  ce problĂšme. Par la suite, les segments appartenant au corail (et non Ă  l’arriĂšre plan) ont Ă©tĂ© classifiĂ©s Ă  l’aide d’un autre SVM entraĂźnĂ© Ă  cet effet. Les rĂ©sultats obtenus dĂ©montrent qu’il est possible d’implĂ©menter un tel systĂšme de reconnaissance automatisĂ©e du benthos. Toutefois, plusieurs conditions devront ĂȘtre respectĂ©es pour en assurer le succĂšs : (1) pour ĂȘtre robuste, le systĂšme de segmentation et de classification de corail doit ĂȘtre entraĂźnĂ© avec un nombre suffisant d'Ă©chantillons et (2) le protocole d'acquisition des donnĂ©es et d’extraction de descripteurs doit ĂȘtre bien dĂ©fini pour maximiser les performances

    Exploitation des réseaux principaux des voiries d'agglomération : schéma directeur d'exploitation de la route : réseaux de niveau 1. Guide méthodologique

    Get PDF
    Le guide pour l'exploitation des rĂ©seaux de niveau 1 s'inscrit dans le cadre du SchĂ©ma Directeur d'Exploitation de la Route ; il est destinĂ© en premier lieu aux gestionnaires de rĂ©seaux, mais Ă©galement aux concepteurs de la politique d'exploitation, qu'ils soient les uns et les autres liĂ©s Ă  l'État ou aux collectivitĂ©s locales. Ce document est un guide mĂ©thodologique au sens strict du terme, c'est-Ă -dire qu'il propose une dĂ©marche allant de la dĂ©finition de la problĂ©matique Ă  non pas la conception du projet mais plutĂŽt Ă  la fourniture des Ă©lĂ©ments de rĂ©flexion pour avancer dans les Ă©tudes prĂ©alables Ă  cette conception. Les recommandations donnĂ©es dans cet ouvrage sont le fruit d'expĂ©riences. NĂ©anmoins sur un certain nombres de points, l'Ă©tat actuel des connaissances ne permettant pas de se prononcer, le parti a Ă©tĂ© de porter Ă  connaissance les solutions envisageables sans se prononcer de façon dĂ©cisive. C'est pourquoi, les Ă©lĂ©ments proposĂ©s ne constituent en aucun cas un cadre rigide mais bien au contraire une base pour mettre en lumiĂšre les piĂšges Ă  Ă©viter et donner quelques conseils. De plus, en fonction du contexte local, des amendements Ă  la dĂ©marche gĂ©nĂ©rale pourront ĂȘtre proposĂ©s . Le domaine traitĂ© Ă©tant en constante Ă©volution, des Ă©ditions ultĂ©rieures pourront s'enrichir des expĂ©riences et des technologies Ă  venir. Le guide se compose de quatre grandes parties : - la premiĂšre propose une dĂ©marche d'Ă©tudes lors de ce que nous avons appelĂ© la phase prĂ©paratoire, - la deuxiĂšme dĂ©veloppe plutĂŽt les Ă©lĂ©ments utiles pour des Ă©tudes permettant une bonne conduite de l'opĂ©ration, - la troisiĂšme expose le volet Ă©valuation qui nĂ©cessairement recouvre les deux premiĂšres parties. Il est complĂ©tĂ© par une quatriĂšme partie composĂ©e des annexes et d'une bibliographie, visant Ă  dĂ©velopper de maniĂšre plus fine quelques thĂšmes que nous avons jugĂ© pertinent d'Ă©voquer mais sans rechercher l'exhaustivitĂ© et Ă  fournir une base de documents auxquels le lecteur pourra s'intĂ©resser. Pour pouvoir faire une bonne utilisation de ce document, il est recommandĂ© dans un premier temps de faire une lecture complĂšte pour s'imprĂ©gner de la dĂ©marche globale suggĂ©rĂ©e. Il est ensuite conseillĂ© de travailler de maniĂšre linĂ©aire partie par partie au moins pour les deux premiĂšres, car les diffĂ©rents chapitres de ces parties forment un tout et caractĂ©risent un niveau d'Ă©laboration du projet . NĂ©anmoins certaines informations demandĂ©es dans les dossiers sanctionnant la premiĂšre partie sont fournies dans la seconde . Cependant, comme le niveau de dĂ©tail demandĂ© dans ces documents est moins important que celui proposĂ© dans le texte de cette seconde partie, il a Ă©tĂ© jugĂ© prĂ©fĂ©rable de les prĂ©senter en une seule fois et de faire rĂ©fĂ©rence aux chapitres correspondants pour l'Ă©laboration du contenu des dossiers. D'autre part, le lecteur trouvera quelquefois des redites . Cette approche a Ă©tĂ© choisie pour Ă©viter des allers-retours trop importants eu Ă©gard au fait que le document peut ĂȘtre utilisĂ© de maniĂšre ponctuelle quelquefois pour prĂ©ciser ou apprĂ©hender un point particulie

    Méthodes et outils pour l'aide à la conception et à la vérification du rendu graphique des systÚmes interactifs

    Get PDF
    La conception de reprĂ©sentations graphiques dĂ©diĂ©es Ă  des systĂšmes interactifs critiques est complexe. Dans cette thĂšse, nous proposons en premier lieu une Ă©tude approfondie des problĂšmes perceptifs spĂ©cifiques aux rendus graphiques au travers de trois Ă©tudes expĂ©rimentales. Nous prĂ©sentons ensuite une analyse de l'activitĂ© Ă  laquelle se livrent les concepteurs d'interfaces critiques. À partir de ces analyses, nous proposons une dĂ©marche d'aide Ă  la conception et Ă  la vĂ©rification des rendus graphiques rĂ©pondant aux besoins spĂ©cifiques des concepteurs. Cette dĂ©marche facilite l'exploration visuelle des solutions, ainsi que la mise en rapport de hiĂ©rarchies fonctionnelles avec des hiĂ©rarchies visuelles. Elle supporte une approche de conception itĂ©rative, centrĂ©e utilisateur et visant un accompagnement sur toute la durĂ©e de vie des systĂšmes. Nous proposons pour finir d'instrumenter cette dĂ©marche Ă  l'aide d'outils interactifs, dont nous illustrons l'utilisation au travers d'Ă©tudes de cas liĂ© Ă  l'aĂ©ronautique (ATC).Graphical representations are used in numerous field of activity as a way to convey information from an interactive system to its users. In some of these fields, the representation quality is vital: indeed, if users (like pilots or air-traffic controllers) have a bad perception of information, the consequences can be tragic. Graphical design and specification of such representations are complex because of the great amount and the diversity of graphical parameters to handle, because of the perceptual interactions between these parameters, and because of the need to manage multidisciplinary knowledge. We claim that these difficulties come also from a lack of tools and methods, which could enable a precise specification of graphical needs. The first part of our work deals with three experimental studies aimed at understanding in a deeper way the perceptive problems linked to the graphical rendering of interactive systems. Then, we expose an analysis of how the graphical designers confront critical interfaces design. Based on these analyses, we propose an approach responding to the specific designer's needs for their activity of designing and verifying the graphical rendering. This approach enables an easier visual exploration of solutions and an easier connection between functional and visual hierarchies. This is a user centered design and iterative approach that aims to follow a system during all its lifetime. Finally, we propose interactive tools that support this approach and we illustrate them with case studies
    • 

    corecore