267 research outputs found

    La définition des annotations linguistiques selon les corpus : de l'écrit journalistique à l'oral

    Get PDF
    ConfrontĂ© Ă  Internet, le Traitement Automatique des Langues (TAL) a dĂ» relever le dĂ©fi que posait l’analyse de textes dialogiques Ă©crits (blog, forum, chat, rĂ©seaux sociaux etc.) et oraux. Les recherches prĂ©sentĂ©es ont, dans un premier temps, portĂ© sur le dĂ©veloppement de systĂšmes Ă  mĂȘme de repĂ©rer et d’analyser l’information Ă  partir d’une annotation des ressources. L’approche retenue privilĂ©gie l’intĂ©gration d’indices inhĂ©rents Ă  la nature de corpus « hors normes » afin d’amĂ©liorer les techniques de traitement automatique. La chaĂźne d’opĂ©rations comprend quatre Ă©tapes :(i) L’observation et l’analyse manuelle des donnĂ©es afin de recenser les variations dans les occurrences et d’évaluer l’ampleur des phĂ©nomĂšnes Ă  annoter, leur classification et l’identification de leurs marqueurs formels.(ii) La modĂ©lisation de l’information Ă  partir d’une typologie sous la forme d’un jeu d’étiquettes ajustĂ© Ă  la nature du corpus.(iii) La dĂ©finition de la technologie congrue (gĂ©nĂ©ralement, l’arbitrage entre le dĂ©veloppement d’un nouvel outil et l’adaptation d’un outil existant).(iv) L’implĂ©mentation du schĂ©ma d’annotation dĂ©fini afin de procĂ©der Ă  une analyse quantitative et qualitative des rĂ©sultats.L’annotation effectuĂ©e concerne les domaines de la syntaxe (Ă©tiquetage morpho-syntaxique et chunking), sĂ©mantique et/ou pragmatique (entitĂ©s nommĂ©es, indices d’identification de la personne, reformulations etc.). L’application concerne aussi bien des entretiens transcrits que des titres de cartes gĂ©ographiques, des recettes d’omelette que des articles du Monde. Les mĂ©thodes utilisĂ©es varient en fonction du corpus et de la tĂąche traitĂ©e. L’annotation syntaxique et le repĂ©rage des segments reformulĂ©s sont fondĂ©s sur la technique d’apprentissage automatique avec les CRFs ; le repĂ©rage des entitĂ©s nommĂ©es et des indices d’identification de la personne dans les transcriptions de l’oral utilise les mĂ©thodes symboliques ; la dĂ©tection automatique des tours de parole contenant la reformulation emploie les mĂ©thodes heuristiques. Le travail sur le français parlĂ© et son annotation a conduit Ă  la modĂ©lisation des caractĂ©ristiques propres Ă  l’oral : disfluences, marqueurs discursifs, prĂ©sentateurs, segmentation, commentaires personnels etc. Un autre phĂ©nomĂšne caractĂ©ristique de l’oral, la reformulation, a fait l’objet d’une Ă©tude particuliĂšre. Le travail sur l’annotation du corpus oral, du corpus Web ou du corpus mĂ©diatique a permis de reconsidĂ©rer la notion de subjectivitĂ© qui constitue l’une des difficultĂ©s rĂ©currentes du traitement automatique. L’étude de la subjectivitĂ© et son expression dans le discours a Ă©tĂ© poursuivie dans plusieurs des recherches menĂ©es : la subjectivitĂ© Ă  partir des informations personnelles livrĂ©es par le locuteur, la subjectivitĂ© dans la perception et l’appropriation des lieux, la subjectivitĂ© dans les recettes de cuisine et enfin la subjectivitĂ© exprimĂ©e Ă  travers les noms gĂ©nĂ©raux

    Les tribulations d'un nom propre en traduction (étude contrastive du nom propre et de sa traduction à partir d'un corpus aligné de dix langues européennes)

    Get PDF
    Les noms propres sont omniprésents et intéressent, depuis des siÚcles, philosophes et linguistes. Le travail réalisé ici est une étude contrastive des noms propres en traduction, divisée en quatre parties. Les deux premiÚres parties sont théoriques. La premiÚre partie traite de la notion de nom propre en linguistique anglaise et en linguistique française. La deuxiÚme partie présente les différents procédés de traduction, illustrés par des exemples sur les noms propres. Les deux parties suivantes sont expérimentales. La troisiÚme partie détaille les différentes étapes de la constitution de notre corpus multilingue parallÚle aligné et annoté, composé de onze versions du roman de Jules Verne, Le Tour du Monde en quatre-vingts jours, en dix langues européennes. La quatriÚme partie expose les résultats obtenus suite à l observation du comportement des noms propres en traduction.Cette étude contredit souvent l hypothÚse largement répandue de leur intraduisibilité.Proper names are omnipresent and have long held the interest of both philosophers and linguists.Our work, divided into four parts, presents, from a contrastive perspective, the behaviour of proper names in translation.The first two parts are theoretical. Firstly, we give a general presentation of what is a proper name from the point of view of both English and French linguistics. Secondly, we introduce the different translation processes proper nouns can undergo.The last two parts are experimental. We begin by explaining the different phases in the process of constitution of our aligned and annotated multilingual parallel corpus, composed of eleven versions of Jules Verne s novel, Le Tour du monde en quatre-vingts jours, in ten European languages. We then present the results obtained from the observation of proper names behaviour in translation.These results often contradict the widespread idea regarding proper names untranslatability.TOURS-Bibl.électronique (372610011) / SudocSudocFranceF

    Exploration textuelle du discours d'un quotidien régional au carrefour du XIX<sup>e</sup> et du XX<sup>e</sup> siÚcles : <i>Le Petit Comtois</i> (1883-1903)

    Get PDF
    In contrast to topical trends of mediatic discourse analysis (predominantly focused on newspapers from the 21st century), this thesis aims at analyzing the discourse of a French newspaper called Le Petit Comtois (1883-1944). Rooted in various fields of research, namely corpus linguistics, “discourse analysis from a historical viewpoint” (Robin, Maldidier, Guilhaumou), “textual analysis of discourse“ (Adam, Heidmann) and lexical statistics (Lebart, Salem), this thesis questions the contributions of a new numerical philology (Rastier; Viprey).This work is based on two complementary axes of research: on the one hand, we worked on the constitution of a textual database with the aim of accurately editing, controlling and normalizing it in order to allow for a revival of interdisciplinary studies led on regional 19th century newspapers. Therefore, our point is to propose some methodological approaches in order to overcome technical obstacles which occur during the acquisition and the sharing of large volume of textual data. The construction and the normalization of the database condition the heuristic confrontation of points of views and the choice of textual sciences methods for the analysis.On the other hand, our objectives are to highlight the specificities of Le Petit Comtois discourse during the period 1883-1903. Exploring a 5.5 million-word corpus, we mainly use the textual statistical methods to produce the emergence of the linguistic, textual and discursive reliefs of the text itself in order to use them as clues for the continuation of the analysis, with the aim to overtake the traditional entrance of the vocabulary used in lexicometry and its ways to approach textuality.À la diffĂ©rence des tendances actuelles de l’analyse du discours mĂ©diatique, majoritairement tournĂ©e vers la presse nationale contemporaine, notre thĂšse vise un titre rĂ©gional du XIXe siĂšcle : Le Petit Comtois (1883-1944). Plongeant ses racines dans diffĂ©rents terreaux de recherche, Ă  savoir la linguistique de corpus, l’analyse du discours du cĂŽtĂ© de l’histoire (Guilhaumou, Robin), la statistique textuelle (Lebart, Salem) et l’analyse textuelle du discours (Adam, Heidmann), cette thĂšse interroge les apports d’une nouvelle philologie numĂ©rique (Rastier; Viprey, Mayaffre) se fixant pour programme de renforcer l’accĂšs aux matĂ©rialitĂ©s discursives.Cette thĂšse articule ainsi deux axes de recherche complĂ©mentaires : d’une part, les conditions de la constitution d’une base de donnĂ©es textuelles finement Ă©tablies, contrĂŽlĂ©es et normalisĂ©es selon les recommandations XML-TEI, visant Ă  favoriser le renouveau des lectures interdisciplinaires de la presse rĂ©gionale de la TroisiĂšme RĂ©publique (chapitre II).Il s’agit, ce faisant, de proposer des pistes mĂ©thodologiques en vue de la levĂ©e des obstacles techniques pesant sur l’acquisition et le partage de grands volumes de donnĂ©es textuelles, dont dĂ©pendent les avancĂ©es des sciences du texte. Partant, on replacera ces pistes dans la perspective des dĂ©bats thĂ©oriques contemporains en linguistique textuelle et linguistique de corpus.D’autre part, notre objectif est d’apporter un Ă©clairage sur le discours du Petit Comtois sur la pĂ©riode 1883-1903 Ă  partir d’un corpus de 5,5 millions de mots en articulant diverses mĂ©thodologies et niveaux d’analyse, de sorte Ă  apprĂ©hender dans toute son hĂ©tĂ©rogĂ©nĂ©itĂ© et sa complexitĂ© l’objet texte. Si notre recherche s’appuie principalement sur les outils de la statistique textuelle qui permettent de faire monter du corpus lui-mĂȘme ses reliefs linguistiques, textuels, discursifs, envisagĂ©s comme des vecteurs d’exploration, elle vise Ă  dĂ©passer la traditionnelle entrĂ©e du vocabulaire sur laquelle se fonde la lexicomĂ©trie, et ses modes d’approche traditionnels sur cette entrĂ©e mĂȘme.Parce qu’un texte est tout d’abord inscrit sur un support matĂ©riel signifiant, notre premier temps d’analyse textuelle du discours du Petit Comtois (chapitre III) est ainsi consacrĂ© Ă  l’analyse de la mise en forme de l’information, telle qu’elle se donne Ă  lire Ă  travers l’organisation matĂ©rielle de l’aire scripturale (Peytard) et les niveaux d’organisation que sont le rubriquage et le systĂšme de titres du quotidien.Plus qu’un simple « chemin de fer » ayant pour fonction de catĂ©goriser l’information, le rubriquage constitue un des ressorts principaux de la rĂ©daction pour hiĂ©rarchiser l’information. Parce qu’il rend compte des catĂ©gories par lesquelles le quotidien dĂ©coupe le monde, ce niveau constitue un lieu d’accĂšs privilĂ©giĂ© Ă  l’identitĂ© du quotidien. Une analyse quantitative du rubriquage, mesurant la surface, l’emplacement topographique de chaque rubrique, sa frĂ©quence moyenne, nous a permis d’observer, outre les thĂ©matiques principales du quotidien, les stratĂ©gies par lesquelles celui-ci hiĂ©rarchisait l’information. Ce volet d’analyse nous a permis d’observer que Le Petit Comtois, Ă  l’instar de la presse quotidienne rĂ©gionale de la TroisiĂšme RĂ©publique, fait la part belle aux Ă©vĂ©nements de portĂ©e nationale et internationale, ainsi qu’à la vie politique de la TroisiĂšme RĂ©publique. Un examen linguistique des intitulĂ©s de rubrique du journal a pour sa part dĂ©montrĂ© la forte mise en valeur de la coĂŻncidence de la temporalitĂ© de l’imprimĂ© quotidien avec celle du monde, ainsi qu’une forte persistance des liens avec la matrice littĂ©raire (ThĂ©renty), perceptible notamment Ă  travers la prĂ©dominance des intitulĂ©s de rubrique rĂ©fĂ©rant Ă  l’écriture Ă©pistolaire.Notre intĂ©rĂȘt s’est ensuite portĂ© sur les titres du Petit Comtois, dont nous avons interrogĂ© les caractĂ©ristiques linguistiques et fonctionnelles, les variations et les rĂ©gularitĂ©s en diachronie. Celles-ci ont Ă©tĂ© analysĂ©es Ă  partir de l’étude d’un sous-corpus substantiel de 6910 titres, extrait d’une des rares rubriques comportant des titres de façon permanente de 1883 Ă  1903 : les « dĂ©pĂȘches de nuit ». En premier lieu, au terme de l’analyse, a Ă©tĂ© dĂ©gagĂ©e la fonction de classification de l’information dans un horizon thĂ©matique, gĂ©ographique ou historique assurĂ©e par les titres, au dĂ©triment d’une fonction d’annonce et de condensation de l’information principale de la dĂ©pĂȘche. En second lieu, dans cette rubrique emblĂ©matique du journalisme d’information inscrite dans un quotidien revendiquant sa fonction d’organe porte-parole d’une sensibilitĂ© politique, les titres sont le lieu d’une coloration de l’information livrĂ©e par la voix du correspondant ou de l’agence Havas et donc des indices prĂ©cieux de l’ethos discursif (Amossy) du quotidien : tout en exprimant sa lecture de l’actualitĂ©, Le Petit Comtois recourt Ă  une parole railleuse et ludique, un certain franc-parler, visant Ă  entretenir la connivence et la proximitĂ© avec son lecteur.Dans un second mouvement (chapitre IV), nous avons entrepris une sĂ©rie d’explorations dans le vocabulaire du Petit Comtois, entendues comme le socle d’un parcours objectivĂ© du discours du journal. Une sĂ©rie de prise de vue sur le vocabulaire du Petit Comtois ont ainsi Ă©tĂ© constituĂ©es.L’index hiĂ©rarchique du corpus, analyse fort classique en lexicomĂ©trie, a livrĂ© une premiĂšre indication sur la consistance lexico-thĂ©matique du corpus, en confirmant notamment l’ouverture du quotidien sur un horizon politique dont Paris est le cƓur gĂ©ographique et l’importance de la temporalitĂ© dans Le Petit Comtois.Une seconde analyse, tout aussi classique en lexicomĂ©trie, a consistĂ© Ă  examiner la ventilation du vocabulaire en diachronie (ou niveau macro-distributionnel) grĂące aux mĂ©thodologies de l’AFC : celle-ci a pointĂ© pour sa part une trĂšs nette division du corpus en deux sĂ©quences chronologiques distinctes : 1884-1896 d’une part, et 1897-1903 d’autre part. L’analyse des profils macro-distributionnels des items, associĂ©e Ă  un mouvement de retour au texte, nous ont permis d’interprĂ©ter ce clivage comme l’opposition entre une premiĂšre sĂ©quence marquĂ©e par un contexte colonialiste et revanchard ainsi que par les fameuses « affaires » politico-financiĂšres, et une sĂ©quence chronologique tĂ©moignant pour sa part d’un tournant radical et de l’intensification des dĂ©bats autour de la question sociale.Nous nous sommes ensuite tournĂ©e vers l’analyse de la configuration fine du vocabulaire (niveau micro-distributionnel - Harris), mode d’accĂšs privilĂ©giĂ© Ă  la textualitĂ©-texture, Ă  ses dimensions non linĂ©aires (tabulaires, rĂ©ticulaires), encore insuffisamment exploitĂ©es et conceptualisĂ©es. L’analyse micro-distributionnelle du vocabulaire du Petit Comtois a ainsi suggĂ©rĂ© que la configuration fine du vocabulaire s’organisait autour de quatre pĂŽles isotropiques (Viprey), Ă  consistance lexico-thĂ©matique voire rhĂ©torico-stylistique, Ă©voquant respectivement (1) les faits divers et leur passage en justice, (2) la vie lĂ©gislative, (3) les rĂ©seaux locaux de sociabilitĂ©s, et enfin, (4) le vocabulaire du politique, voire de l’idĂ©e rĂ©publicaine.Nous avons voulu observer l’évolution diachronique de cette configuration fine en diachronie. De façon trĂšs stimulante, si l’on tient compte des rĂ©sultats livrĂ©s par l’examen du niveau macro-distributionnel et de la nature du discours Ă©tudiĂ©, la structure fine du vocabulaire se rĂ©vĂšle extrĂȘmement stable en diachronie. De rares items tĂ©moignent d’une Ă©volution significative de leur co(n)texte d’une diachronie Ă  une autre. Il est intĂ©ressant de remarquer que ceux-ci sont particuliĂšrement emblĂ©matiques des Ă©volutions socio-politiques dont prend acte la fin d’un trĂšs long XIXe siĂšcle. C’est notamment le cas de la forme ouvriers, dont l’évolution trĂšs nette du profil collocatif marque celle de son sens. Dans un dernier temps, nous avons examinĂ© les facteurs responsables de la stabilitĂ© du rubriquage observĂ©e : l’analyse des spĂ©cificitĂ©s des rubriques a ainsi rĂ©vĂ©lĂ© une forte corrĂ©lation entre le niveau du rubriquage et celle de la structure fine du vocabulaire. L’invariance des « motifs » lexicaux et stylistiques du quotidien nous suggĂšre donc que l’actualitĂ© et son essence prĂ©supposĂ©e « fluctuante », restent contrĂŽlĂ©es et organisĂ©es par les pratiques routiniĂšres journalistiques, renvoyant tant Ă  la sĂ©lection de l’information qu’à sa mise en scĂšne comme Ă©vĂ©nement. Enfin, un dernier temps de cette recherche (chapitre V) est dĂ©diĂ© Ă  la consolidation d’une mĂ©thode de typologie en corpus, appliquĂ©e au classement des rubriques, basĂ©e sur le niveau morphosyntaxique. À la recherche d’une typologie discursive des rubriques du Petit Comtois, ce volet d’analyse examine les vertus et les insuffisances d’un Ă©tiquetage automatique et explore les perspectives offertes par l’AFC en vue d’un dialogue continuĂ© avec les donnĂ©es. Devant ĂȘtre envisagĂ© comme le prĂ©alable Ă  une analyse linguistique des genres journalistiques qui croiserait le niveau du vocabulaire et le niveau de la morphosyntaxe tout en tenant compte du plan compositionnel du texte (Bakhtine) grĂące Ă  un encodage xml-tei, cet empan de nos recherches constitue une investigation mĂ©thodologique visant Ă  se doter d’un protocole robuste et transparent d’analyse.À la suite des travaux pionniers de Douglas Biber, de nombreuses Ă©tudes de typologie textuelle convoquent aujourd’hui le niveau morphosyntaxique. La logomĂ©trie, telle que dĂ©finie par D. Mayaffre, perçoit d’ailleurs dans les progrĂšs de l’étiquetage automatique un renouvellement dĂ©cisif de l’analyse des donnĂ©es textuelles. Cette position implique de s’accommoder du taux d’erreur intrinsĂšque aux donnĂ©es issues d’un Ă©tiquetage automatique, dont l’influence est supposĂ©e modĂ©rĂ©e par la mĂ©thodologie statistique utilisĂ©e. Une analyse du discours soucieuse de la matĂ©rialitĂ© du texte ne peut nĂ©anmoins se satisfaire de ce taux d’erreur : entendant l’annotation morphosyntaxique comme un vĂ©ritable Ă©tat du texte, elle implique au contraire un Ă©tiquetage fin du niveau morphosyntaxique. Or, l’expĂ©rience menĂ©e dans le cadre d’une entreprise typologique des rubriques du Petit Comtois montre que l’étiquetage automatique rĂ©alisĂ© par Cordial est loin d’ĂȘtre suffisant pour rĂ©pondre Ă  cette prĂ©tention : l’étiquetage opĂ©rĂ© reste un Ă©tiquetage « en langue », aux insuffisances duquel s’ajoutent les limites du lexique interne de Cordial. On regrettera par ailleurs la pertinence discutable des catĂ©gories statiques de la grammaire traditionnelle convoquĂ©e par ce logiciel.En raison de ces insuffisances et en attendant de mener une contre-expĂ©rimentation basĂ©e sur un Ă©tiquetage fin et contrĂŽlĂ© de nos donnĂ©es, il nous semble ainsi devoir prendre quelques prĂ©cautions avec les rĂ©sultats obtenus de notre analyse, fort stimulants au demeurant. En effet, notre analyse des variables morphosyntaxiques dans les rubriques du Petit Comtois met au jour des facteurs trĂšs discriminants, parmi lesquels, d’une part, des variables assez inattendues (Ă  l’instar des dĂ©terminants dĂ©finis) et d’autre part, des facteurs faisant Ă©cho aux critĂšres gĂ©nĂ©riques journalistiques. On peut interprĂ©ter la configuration typologique des rubriques obtenue comme Ă©tant notamment fortement structurĂ©e par l’opposition entre les productions discursives Ă  Ă©nonciation impliquĂ©e et les productions caractĂ©risĂ©es par un effacement Ă©nonciatif, configuration affinĂ©e par le degrĂ© de complexitĂ© des phrases et leur longueur. Le genre semble donc un « facteur » structurant de cette typologie, ce qui nous semble devoir ĂȘtre mis en lien avec la taille colossale du corpus Ă©tudiĂ© et la mĂ©thodologie statistique utilisĂ©, puisque l’AFC donne une reprĂ©sentation synthĂ©tique des tendances lourdes voire structurelles d’un ensemble de donnĂ©es. En l’occurrence, le genre est cette tendance, qui, dans la lignĂ©e des postulats de l’analyse du discours, s’avĂšre dĂ©terminant dans la typologisation des productions discursives journalistique du Petit Comtois

    La "lexicologie explicative et combinatoire" dans le traitement des unités lexicales spécialisées

    Full text link
    ThÚse diffusée initialement dans le cadre d'un projet pilote des Presses de l'Université de Montréal/Centre d'édition numérique UdeM (1997-2008) avec l'autorisation de l'auteur

    Contribution à une étude des dysfonctionnements morphosyntaxiques en français chez un groupe d'enseignants et d'étudiants yéménites

    Get PDF
    French is the third language taught in Yemen after Arabic and English. This vitality of French requires the creation of didactic supports, in order to help in its learning. The purpose of the thesis is to highlight the areas of French, which are sources of difficulty for students, in terms of morphology and syntax, to classify and to describe them. The study of errors is based on two corpus of written work, one which has been done by thirty students in the fourth year of the license of the French Department of Thamar University, the other one by fifteen high school teachers, graduated in the same department. This study aims to introduce a reflection, in the French departments of the Yemenite universities, about strategies and objectives of the teaching of French as a language, in a non-French-speaking multilingual environment. It also aims to provide didactic resources for the study of the language to the teachers, trying to highlighting the priorities.Le français est la troisiĂšme langue enseignĂ©e au YĂ©men aprĂšs l'arabe et l'anglais. Cette vitalitĂ© du français nĂ©cessite la crĂ©ation de supports didactiques, afin d'aider Ă  son apprentissage. L'objet de la thĂšse est de mettre en Ă©vidence les zones du français, qui sont sources de difficultĂ©s pour les Ă©tudiants tant sur le plan de la morphologie que sur celui de la syntaxe, de les classer et de les dĂ©crire. L'Ă©tude des erreurs s'appuiera sur deux corpus de travaux Ă©crits effectuĂ©s, l'un par trente Ă©tudiants de quatriĂšme annĂ©e de licence du dĂ©partement de français de l'universitĂ© de Dhamar, l'autre par quinze enseignants de lycĂ©e diplĂŽmĂ©s du mĂȘme dĂ©partement. Cette Ă©tude a pour finalitĂ© d'initier une rĂ©flexion, au sein des dĂ©partements de français des universitĂ©s yĂ©mĂ©nites, sur les stratĂ©gies et les objectifs de l'enseignement du français en tant que langue, dans un milieu plurilingue non francophone. Elle vise Ă©galement Ă  offrir des ressources didactiques en matiĂšre d'Ă©tude de la langue aux enseignants, en tentant de mettant en Ă©vidence des prioritĂ©s

    Analyse et représentation de la variation terminologique et de la multidimentionalité dans un thésaurus : le cas du métalangage de la terminologie

    Full text link
    Le prĂ©sent travail consiste Ă  proposer un modĂšle de reprĂ©sentation des notions thĂ©oriques et pratiques de la terminologie et de leurs relations sous forme de thĂ©saurus. Selon la norme ISO 25964-1, 2011, « un thĂ©saurus est un vocabulaire contrĂŽlĂ© et structurĂ© dans lequel les concepts sont reprĂ©sentĂ©s par des termes, ayant Ă©tĂ© organisĂ©s afin de rendre explicites les relations entre les concepts (
) ». Notre objectif est de crĂ©er un outil pĂ©dagogique Ă  la suite d’une rĂ©flexion thĂ©orique englobant diffĂ©rentes perspectives notionnelles au sein de cette discipline. Les enjeux soulevĂ©s par la classification des concepts de certains champs de savoir (notamment ceux donnant lieu Ă  diffĂ©rentes perspectives) n’ont pas Ă©tĂ© approfondis suffisamment dans la littĂ©rature de la terminologie, ni dans celle portant sur les thĂ©saurus. Comment dĂ©crire des concepts qui sont sujets Ă  des dissensions thĂ©oriques entre les diffĂ©rentes Ă©coles de pensĂ©e? Comment classer les diffĂ©rentes relations entretenues par les concepts thĂ©oriques et les applications pratiques d’une discipline? À ces questions s’ajoute celle de la prise en compte de ces difficultĂ©s dans un thĂ©saurus. Nous commençons par dĂ©limiter et organiser les concepts saillants du domaine. Ensuite, Ă  l’aide d’un corpus comprenant des publications associĂ©es Ă  diffĂ©rentes approches de la terminologie, nous Ă©tudions les rĂ©alisations linguistiques de ces concepts et leurs relations en contexte, dans le but de les dĂ©crire, de les classer et de les dĂ©finir. Puis, nous faisons l’encodage de ces donnĂ©es Ă  l’aide d’un logiciel de gestion de thĂ©saurus, en respectant les normes ISO applicables. La derniĂšre Ă©tape consiste Ă  dĂ©finir la visualisation de ces donnĂ©es afin de la rendre conviviale et comprĂ©hensible. Enfin, nous prĂ©sentons les caractĂ©ristiques fondamentales du ThĂ©saurus de la terminologie. Nous avons analysĂ© et reprĂ©sentĂ© un Ă©chantillon de 45 concepts et leurs termes reliĂ©s. Les diffĂ©rents phĂ©nomĂšnes associĂ©s Ă  ces descripteurs comme la multidimensionalitĂ©, la variation conceptuelle et la variation dĂ©nominative sont aussi reprĂ©sentĂ©s dans notre thĂ©saurus.This thesis proposes a model to represent theoretical and practical concepts of terminology as well as their terminological relationships in the form of a thesaurus. According to the ISO 25964-1:2011 standard, “a thesaurus is a controlled and structured vocabulary in which concepts are represented by terms that have been previously arranged in order to show explicitly the relations among concepts (
)”. Our objective is to create a pedagogical tool that is grounded in a theoretical reflection about different theoretical perspectives within this discipline. The issues associated with the classification of concepts in certain fields of knowledge (especially those with different perspectives) require further study in the field of terminology and information science, and in the literature relating to thesauri. Indeed, how does one describe concepts that are subject to theoretical dissent and different schools of thought? How can the different relationships between theoretical concepts and practical applications of a discipline be classified? To these questions is added the additional challenge of reflecting these difficulties in a thesaurus. Our first step consists in delimiting and organizing the main concepts of the field. Then, by means of a corpus containing different publications associated with different approaches in terminology, we study the linguistic realizations of those concepts and their relationships in context, with the objective of describing, classifying and defining them. We then encode this data using thesaurus management software that respects the relevant ISO standards. Finally, we produce visualizations of this data to make it more user friendly and understandable. To conclude, we present the fundamental characteristics of the ThĂ©saurus de la terminologie. We have analyzed and presented a sample of 45 concepts and their related terms. Different phenomena related to these descriptors, such as multidimensionality, conceptual variation and denominative variation, are also represented in our thesaurus

    Traduction des opérations de l'analyse historique dans le langage conceptuel des systÚmes d'information géographique pour une exploration des processus morphologiques de la ville et du territoire

    Get PDF
    Present work intends to conceive an interface between Urban Morphology and Geographic Information Science (GISc). This interface is considered as a space of exchange for knowledge exploration between several disciplines. The links pointed out from this theoretical work help us define the framework of formalization of morphological processes. We have focused our efforts over the methodology of translation of the notion of morphological process. The main steps of translation of the historical analysis operations into the conceptual language of the GISc mainly include numerical handling of cartographic sources, i.e. maps, plans, cadastre, etc. The main problems encountered are linked to the heterogeneity of historical information such as: partial data sets, non-representative statistical ensembles and semantic relativity of concepts through time (polysemy, synonymy, etc.). We discuss these problems from the knowledge production process point of view. We focus on questions of knowledge emergence from quantitative analysis and, symmetrically, of concept formalization leading to data structures compatible with the idea of characterization. Our work is essentially based on the possibilities of the exploratory paradigm applied to geo-historical data. By doing so, we have been particularly interested in the contributions of the systematic approach to the enhancement of the interpretive potential of classical descriptive morphological analyses. Outcome of work are of different natures. We can mention among others: 1° the construction of a formal classification (ontology) of concepts subsuming transformation and evolution of the city and the territory and 2° the development of an exploratory approach of geo-historical data. We have also discussed the contribution of some social sciences' paradigms (Callon and Latour's sociology of translation, Koselleck's conceptual history (Begriffsgeschichte), Peirce's abduction, Ginzburg's indiciary paradigm, etc.) to GISc. In particular, we are interested in the enhancement of the process of modeling by rethinking the tasks of conceptualization and formalization by taking into account the historical context of production of information during the process of knowledge reduction. We have pointed out the importance of periods of conceptual stability to allow comparative measurements and of events to explain ruptures not only at the data level, but also at the level of the entire conceptualization. These outputs should be considered as a new step towards recognition of the exploratory approach as a relevant tool to face interdisciplinary and complex problems related to urban processes in general. In particular, this work helps us stabilizing the theoretical framework contributing to the definition of the next generation numerical archives and interoperability of systems. Indeed, these technical questions need modelers to take into account different kinds of evolution when dealing with either concepts or instances and to produce a common platform to manage both. Finally, we show some clues to continue this work by introducing collaborative approaches and exploratory multidimensional interfaces. The figure below illustrates the initial framework of this research and the extension resulting from our work

    Moyens informatiques de restitution en archéologie monumentale : cas du temple de Karnak

    Full text link
    L’objectif de notre recherche est l’exploration et l’étude de la question de l’instrumentation informatique des projets de reconstitution archĂ©ologiques en architecture monumentale dans le but de proposer de nouveaux moyens. La recherche a pour point de dĂ©part une question, Ă  savoir : « Comment, et avec quels moyens informatiques, les projets de reconstitution architecturale pourraient-ils ĂȘtre menĂ©s en archĂ©ologie? ». Cette question a nĂ©cessitĂ©, en premier lieu, une Ă©tude des diffĂ©rentes approches de restitution qui ont Ă©tĂ© mises Ă  contribution pour des projets de reconstitution archĂ©ologiques, et ceci, Ă  ses diffĂ©rentes phases. Il s’agit de comprendre l’évolution des diffĂ©rentes mĂ©thodologies d’approche (Ă©pistĂ©mologiquement) que les acteurs de ce domaine ont adoptĂ©es afin de mettre Ă  contribution les technologies d’information et de communication (TIC) dans le domaine du patrimoine bĂąti. Cette Ă©tude nous a permis de dĂ©gager deux principales avenues: une premiĂšre qui vise exclusivement la « reprĂ©sentation » des rĂ©sultats des projets et une seconde qui vise la modĂ©lisation de ce processus dans le but d’assister l’archĂ©ologue dans les diffĂ©rentes phases du projet. Nous dĂ©montrons que c’est la deuxiĂšme approche qui permet la combinaison et met Ă  la disposition des archĂ©ologues une meilleure exploitation des possibilitĂ©s que l’outil informatique peut et pourra prĂ©senter. Cette partie permet de dĂ©montrer la nature systĂ©mique et complexe de la mise Ă  contribution des TICs dans le domaine de la restitution archĂ©ologique. La multitude des acteurs, des conditions techniques, culturelles et autres, des moyens utilisĂ©s ainsi que la variĂ©tĂ© des objectifs envisagĂ©s dans les projets de reconstitution archĂ©ologiques poussent Ă  explorer une nouvelle approche qui tient compte de cette complexitĂ©. Pour atteindre notre objectif de recherche, la poursuite de l’étude de la nature de la dĂ©marche archĂ©ologique s’impose. Il s’agit de comprendre les liens et les interrelations qui s’établissent entre les diffĂ©rentes unitĂ©s techniques et intellectuelles en jeu ainsi que les diffĂ©rents modes de rĂ©flexions prĂ©sents dans les projets de reconstitution archĂ©ologique du patrimoine bĂąti. Cette Ă©tude met en Ă©vidence le rapport direct entre le caractĂšre subjectif de la dĂ©marche avec la grande variabilitĂ© des approches et des raisonnements mis en Ɠuvre. La recherche est alors exploratoire et propositionnelle pour confronter notamment le caractĂšre systĂ©mique et complexe de l’expĂ©rience concrĂšte et Ă  travers les publications savantes, les Ă©lĂ©ments de la rĂ©alitĂ© connaissable. L’étude des raisonnements archĂ©ologiques Ă  travers les publications savantes nous permet de proposer une premiĂšre typologie de raisonnements Ă©tudiĂ©s. Chacune de ces typologies reflĂšte une mĂ©thodologie d’approche basĂ©e sur une organisation d’actions qui peut ĂȘtre consignĂ©e dans un ensemble de modules de raisonnements. Cette recherche fait ressortir, des phĂ©nomĂšnes et des processus observĂ©s, un modĂšle qui reprĂ©sente les interrelations et les interactions ainsi que les produits spĂ©cifiques de ces liaisons complexes. Ce modĂšle tĂ©moigne d’un processus rĂ©cursif, par essais et erreurs, au cours duquel l’acteur « expĂ©rimente » successivement, en fonction des objectifs de l’entreprise et Ă  travers des modules de raisonnements choisis, plusieurs rĂ©ponses aux questions qui se posent Ă  lui, au titre de la dĂ©finition du corpus, de la description, de la structuration, de l’interprĂ©tation et de la validation des rĂ©sultats, jusqu’à ce que cette derniĂšre lui paraisse satisfaire aux objectifs de dĂ©part. Le modĂšle Ă©tabli est validĂ© Ă  travers l’étude de cas du VIIĂšme pylĂŽne du temple de Karnak en Égypte. Les rĂ©sultats obtenus montrent que les modules de raisonnements reprĂ©sentent une solution intĂ©ressante pour assister les archĂ©ologues dans les projets de reconstitution archĂ©ologiques. Ces modules offrent une multiplicitĂ© de combinaisons des actions et avantagent ainsi une diversitĂ© d’approches et de raisonnements pouvant ĂȘtre mis Ă  contribution pour ces projets tout en maintenant la nature Ă©volutive du systĂšme global.The goal of our research is to explore and study the use of computerized tools in archaeological reconstruction projects of monumental architecture in order to propose new ways in which such technology can be used. The first question we ask is: "How and with which computerized tools can architectural reconstruction projects be conducted in archaeology? In our quest to answer this question, we begin with a study of the different restitution approaches used in various phases of archaeological reconstruction projects. This involves understanding how the different methods of approach have evolved (epistemologically), how those involved in such projects have put information and communication technologies to use in the field of built heritage. This study has identified two main avenues: one whose sole aim is the "representation" of project results and another whose aim is to model this process in order to assist the archaeologist through various phases of a project. We have demonstrated that it is the second approach which combines and offers archaeologists a better utilization of the possibilities offered by computer assisted tools. This allowed us to demonstrate the complex and systemic nature of ICT’s in the field of archaeological reconstruction. The multiple actors, conditions, means and goals considered in archaeological reconstruction projects have led us to explore a new approach that reflects this complexity. In order to achieve the goal of our research, it was necessary to further study the nature of the archaeological process. This involved understanding the links and interrelations between the various components that define the archaeological approach and the various thought processes involved in heritage building archaeological reconstruction projects. This study showed a direct relationship between the subjective nature of the process and the diversity of approaches and thought processes which can be implemented. This exploratory and propositional research reinforces the systemic and complex nature of our approach and prompts us to explore, in practice and through published literature, the elements of known reality. The study of archaeological reasoning through academic publications has allowed us to propose an initial typology of arguments studied. Each of these typologies reflects a methodological approach based on organized actions that can be recorded in a set of reasoning modules. This research has allowed us to highlight phenomena and observed processes, leading to a model representing interrelationships and interactions as well as the specific results of these complex interconnections. This pattern reflects a cyclical process of trial and error, in which the actors consecutively 'experience' (according to the project’s goals and through reasoning modules), several answers to the questions exposed to him under the corpus definition, description, structure, interpretation and validation of the results until the latter would appear to meet the original targets. The model developed was validated through a case study of the seventh pylon of the Karnak temple in Egypt. The results show that the reasoning modules offer an interesting solution assisting archaeologists in archaeological reconstruction projects. The multiple action combinations offered by these modules are an advantage to many approaches and thought processes which could be useful to such projects while maintaining the progressive nature of the overall system
    • 

    corecore