338 research outputs found

    Quelques enjeux de la dénomination en terminologie

    Get PDF
    Les expressions linguistiques et non linguistiques de concepts spécialisés sont le plus souvent connues sous le nom de termes, ce qui fixe la terminologie dans le domaine de la sémiologie. Ces expressions font plus souvent l’objet de régulation que les mots ordinaires, bien que le degré d’intervention dépende des secteurs concernés. La régulation de la forme est généralement en relation étroite avec le contenu sémantique, surtout lorsque la terminologie relève de la normalisation officielle ou officieuse. Nous examinons en détail les modes de régulation des dénominations de la forme la plus contrainte de terminologie, à savoir la nomenclature, ici celle des allergènes. La conclusion prend la forme d’une discussion des formes que prend l’expression linguistique des termes, qui fait l’objet d’une attention particulière de nos jours dans le cadre du traitement automatique du langage.The linguistic and non-linguistic expressions of specialised concepts are often referred to as terms, placing terminology firmly in semiology. These forms of expression are more often subject to outside intervention than other words, though the extent of the regulation varies widely from field to field. Regulation of form is usually closely connected to control of semantic content, especially when terminology is a part of standardisation, official or unofficial. As an example of the most highly regulated terminology in form and content special attention is paid to nomenclature, in this case that of allergens. The linguistic expression of terms in all its variation has become the centre of much attention lately with a view to automatic language processing, and some of the implications of this development are discussed

    Acquisition de liens sémantiques à partir d'éléments de mise en forme des textes: exploitation des structures énumératives

    Get PDF
    The past decade witnessed significant advances in the field of relation extraction from text, facilitating the building of lexical or semantic resources. However, the methods proposed so far (supervised learning, kernel methods, distant supervision, etc.) don't fully exploit the texts: they are usually applied at the sentential level and they don't take into account the layout and the formatting of texts.In such a context, this thesis aims at expanding those methods and makes them layout-aware for extracting relations expressed beyond sentence boundaries. For this purpose, we rely on the semantics conveyed by typographical (bullets, emphasis, etc.) and dispositional (visual indentations, carriage returns, etc.) features. Those features often substitute purely discursive formulations. In particular, the study reported here is dealing with the relations carried by the vertical enumerative structures. Although they display discontinuities between their various components, the enumerative structures can be dealt as a whole at the semantic level. They form textual structures prone to hierarchical relations.This study was divided into two parts. (i) The first part describes a model representing the hierarchical structure of documents. This model is falling within the theoretical framework representing the textual architecture: an abstraction of the layout and the formatting, as well as a strong connection with the rhetorical structure are achieved. However, our model focuses primarily on the efficiency of the analysis process rather than on the expressiveness of the representation. A bottom-up method intended for building automatically this model is presented and evaluated on a corpus of PDF documents.(ii) The second part aims at integrating this model into the process of relation extraction. In particular, we focused on vertical enumerative structures. A multidimensional typology intended for characterizing those structures was established and used into an annotation task. Thanks to corpus-based observations, we proposed a two-step method, by supervised learning, for qualifying the nature of the relation and identifying its arguments. The evaluation of our method showed that exploiting the formatting and the layout of documents, in combination with standard lexico-syntactic features, improves those two tasks.Ces dernières années de nombreux progrès ont été faits dans le domaine de l'extraction de relations à partir de textes, facilitant ainsi la construction de ressources lexicales ou sémantiques. Cependant, les méthodes proposées (apprentissage supervisé, méthodes à noyaux, apprentissage distant, etc.) n’exploitent pas tout le potentiel des textes : elles ont généralement été appliquées à un niveau phrastique, sans tenir compte des éléments de mise en forme.Dans ce contexte, l'objectif de cette thèse est d'adapter ces méthodes à l'extraction de relations exprimées au-delà des frontières de la phrase. Pour cela, nous nous appuyons sur la sémantique véhiculée par les indices typographiques (puces, emphases, etc.) et dispositionnels (indentations visuelles, retours à la ligne, etc.), qui complètent des formulations strictement discursives. En particulier, nous étudions les structures énumératives verticales qui, bien qu'affichant des discontinuités entre leurs différents composants, présentent un tout sur le plan sémantique. Ces structures textuelles sont souvent révélatrices de relations hiérarchiques. Notre travail est divisé en deux parties. (i) La première partie décrit un modèle pour représenter la structure hiérarchique des documents. Ce modèle se positionne dans la suite des modèles théoriques proposés pour rendre compte de l'architecture textuelle : une abstraction de la mise en forme et une connexion forte avec la structure rhétorique sont faites. Toutefois, notre modèle se démarque par une perspective d'analyse automatique des textes. Nous en proposons une implémentation efficace sous la forme d'une méthode ascendante et nous l'évaluons sur un corpus de documents PDF. (ii) La seconde partie porte sur l'intégration de ce modèle dans le processus d'extraction de relations. Plus particulièrement, nous nous sommes focalisés sur les structures énumératives verticales. Un corpus a été annoté selon une typologie multi-dimensionnelle permettant de caractériser et de cibler les structures énumératives verticales porteuses de relations utiles à la création de ressources. Les observations faites en corpus ont conduit à procéder en deux étapes par apprentissage supervisé pour analyser ces structures : qualifier la relation puis en extraire les arguments. L'évaluation de cette méthode montre que l'exploitation de la mise en forme, combinée à un faisceau d'indices lexico-syntaxiques, améliore les résultats

    Moyens informatiques de restitution en archéologie monumentale : cas du temple de Karnak

    Full text link
    L’objectif de notre recherche est l’exploration et l’étude de la question de l’instrumentation informatique des projets de reconstitution archéologiques en architecture monumentale dans le but de proposer de nouveaux moyens. La recherche a pour point de départ une question, à savoir : « Comment, et avec quels moyens informatiques, les projets de reconstitution architecturale pourraient-ils être menés en archéologie? ». Cette question a nécessité, en premier lieu, une étude des différentes approches de restitution qui ont été mises à contribution pour des projets de reconstitution archéologiques, et ceci, à ses différentes phases. Il s’agit de comprendre l’évolution des différentes méthodologies d’approche (épistémologiquement) que les acteurs de ce domaine ont adoptées afin de mettre à contribution les technologies d’information et de communication (TIC) dans le domaine du patrimoine bâti. Cette étude nous a permis de dégager deux principales avenues: une première qui vise exclusivement la « représentation » des résultats des projets et une seconde qui vise la modélisation de ce processus dans le but d’assister l’archéologue dans les différentes phases du projet. Nous démontrons que c’est la deuxième approche qui permet la combinaison et met à la disposition des archéologues une meilleure exploitation des possibilités que l’outil informatique peut et pourra présenter. Cette partie permet de démontrer la nature systémique et complexe de la mise à contribution des TICs dans le domaine de la restitution archéologique. La multitude des acteurs, des conditions techniques, culturelles et autres, des moyens utilisés ainsi que la variété des objectifs envisagés dans les projets de reconstitution archéologiques poussent à explorer une nouvelle approche qui tient compte de cette complexité. Pour atteindre notre objectif de recherche, la poursuite de l’étude de la nature de la démarche archéologique s’impose. Il s’agit de comprendre les liens et les interrelations qui s’établissent entre les différentes unités techniques et intellectuelles en jeu ainsi que les différents modes de réflexions présents dans les projets de reconstitution archéologique du patrimoine bâti. Cette étude met en évidence le rapport direct entre le caractère subjectif de la démarche avec la grande variabilité des approches et des raisonnements mis en œuvre. La recherche est alors exploratoire et propositionnelle pour confronter notamment le caractère systémique et complexe de l’expérience concrète et à travers les publications savantes, les éléments de la réalité connaissable. L’étude des raisonnements archéologiques à travers les publications savantes nous permet de proposer une première typologie de raisonnements étudiés. Chacune de ces typologies reflète une méthodologie d’approche basée sur une organisation d’actions qui peut être consignée dans un ensemble de modules de raisonnements. Cette recherche fait ressortir, des phénomènes et des processus observés, un modèle qui représente les interrelations et les interactions ainsi que les produits spécifiques de ces liaisons complexes. Ce modèle témoigne d’un processus récursif, par essais et erreurs, au cours duquel l’acteur « expérimente » successivement, en fonction des objectifs de l’entreprise et à travers des modules de raisonnements choisis, plusieurs réponses aux questions qui se posent à lui, au titre de la définition du corpus, de la description, de la structuration, de l’interprétation et de la validation des résultats, jusqu’à ce que cette dernière lui paraisse satisfaire aux objectifs de départ. Le modèle établi est validé à travers l’étude de cas du VIIème pylône du temple de Karnak en Égypte. Les résultats obtenus montrent que les modules de raisonnements représentent une solution intéressante pour assister les archéologues dans les projets de reconstitution archéologiques. Ces modules offrent une multiplicité de combinaisons des actions et avantagent ainsi une diversité d’approches et de raisonnements pouvant être mis à contribution pour ces projets tout en maintenant la nature évolutive du système global.The goal of our research is to explore and study the use of computerized tools in archaeological reconstruction projects of monumental architecture in order to propose new ways in which such technology can be used. The first question we ask is: "How and with which computerized tools can architectural reconstruction projects be conducted in archaeology? In our quest to answer this question, we begin with a study of the different restitution approaches used in various phases of archaeological reconstruction projects. This involves understanding how the different methods of approach have evolved (epistemologically), how those involved in such projects have put information and communication technologies to use in the field of built heritage. This study has identified two main avenues: one whose sole aim is the "representation" of project results and another whose aim is to model this process in order to assist the archaeologist through various phases of a project. We have demonstrated that it is the second approach which combines and offers archaeologists a better utilization of the possibilities offered by computer assisted tools. This allowed us to demonstrate the complex and systemic nature of ICT’s in the field of archaeological reconstruction. The multiple actors, conditions, means and goals considered in archaeological reconstruction projects have led us to explore a new approach that reflects this complexity. In order to achieve the goal of our research, it was necessary to further study the nature of the archaeological process. This involved understanding the links and interrelations between the various components that define the archaeological approach and the various thought processes involved in heritage building archaeological reconstruction projects. This study showed a direct relationship between the subjective nature of the process and the diversity of approaches and thought processes which can be implemented. This exploratory and propositional research reinforces the systemic and complex nature of our approach and prompts us to explore, in practice and through published literature, the elements of known reality. The study of archaeological reasoning through academic publications has allowed us to propose an initial typology of arguments studied. Each of these typologies reflects a methodological approach based on organized actions that can be recorded in a set of reasoning modules. This research has allowed us to highlight phenomena and observed processes, leading to a model representing interrelationships and interactions as well as the specific results of these complex interconnections. This pattern reflects a cyclical process of trial and error, in which the actors consecutively 'experience' (according to the project’s goals and through reasoning modules), several answers to the questions exposed to him under the corpus definition, description, structure, interpretation and validation of the results until the latter would appear to meet the original targets. The model developed was validated through a case study of the seventh pylon of the Karnak temple in Egypt. The results show that the reasoning modules offer an interesting solution assisting archaeologists in archaeological reconstruction projects. The multiple action combinations offered by these modules are an advantage to many approaches and thought processes which could be useful to such projects while maintaining the progressive nature of the overall system
    • …
    corecore