267 research outputs found
La définition des annotations linguistiques selon les corpus : de l'écrit journalistique à l'oral
ConfrontĂ© Ă Internet, le Traitement Automatique des Langues (TAL) a dĂ» relever le dĂ©fi que posait lâanalyse de textes dialogiques Ă©crits (blog, forum, chat, rĂ©seaux sociaux etc.) et oraux. Les recherches prĂ©sentĂ©es ont, dans un premier temps, portĂ© sur le dĂ©veloppement de systĂšmes Ă mĂȘme de repĂ©rer et dâanalyser lâinformation Ă partir dâune annotation des ressources. Lâapproche retenue privilĂ©gie lâintĂ©gration dâindices inhĂ©rents Ă la nature de corpus « hors normes » afin dâamĂ©liorer les techniques de traitement automatique. La chaĂźne dâopĂ©rations comprend quatre Ă©tapes :(i) Lâobservation et lâanalyse manuelle des donnĂ©es afin de recenser les variations dans les occurrences et dâĂ©valuer lâampleur des phĂ©nomĂšnes Ă annoter, leur classification et lâidentification de leurs marqueurs formels.(ii) La modĂ©lisation de lâinformation Ă partir dâune typologie sous la forme dâun jeu dâĂ©tiquettes ajustĂ© Ă la nature du corpus.(iii) La dĂ©finition de la technologie congrue (gĂ©nĂ©ralement, lâarbitrage entre le dĂ©veloppement dâun nouvel outil et lâadaptation dâun outil existant).(iv) LâimplĂ©mentation du schĂ©ma dâannotation dĂ©fini afin de procĂ©der Ă une analyse quantitative et qualitative des rĂ©sultats.Lâannotation effectuĂ©e concerne les domaines de la syntaxe (Ă©tiquetage morpho-syntaxique et chunking), sĂ©mantique et/ou pragmatique (entitĂ©s nommĂ©es, indices dâidentification de la personne, reformulations etc.). Lâapplication concerne aussi bien des entretiens transcrits que des titres de cartes gĂ©ographiques, des recettes dâomelette que des articles du Monde. Les mĂ©thodes utilisĂ©es varient en fonction du corpus et de la tĂąche traitĂ©e. Lâannotation syntaxique et le repĂ©rage des segments reformulĂ©s sont fondĂ©s sur la technique dâapprentissage automatique avec les CRFs ; le repĂ©rage des entitĂ©s nommĂ©es et des indices dâidentification de la personne dans les transcriptions de lâoral utilise les mĂ©thodes symboliques ; la dĂ©tection automatique des tours de parole contenant la reformulation emploie les mĂ©thodes heuristiques. Le travail sur le français parlĂ© et son annotation a conduit Ă la modĂ©lisation des caractĂ©ristiques propres Ă lâoral : disfluences, marqueurs discursifs, prĂ©sentateurs, segmentation, commentaires personnels etc. Un autre phĂ©nomĂšne caractĂ©ristique de lâoral, la reformulation, a fait lâobjet dâune Ă©tude particuliĂšre. Le travail sur lâannotation du corpus oral, du corpus Web ou du corpus mĂ©diatique a permis de reconsidĂ©rer la notion de subjectivitĂ© qui constitue lâune des difficultĂ©s rĂ©currentes du traitement automatique. LâĂ©tude de la subjectivitĂ© et son expression dans le discours a Ă©tĂ© poursuivie dans plusieurs des recherches menĂ©es : la subjectivitĂ© Ă partir des informations personnelles livrĂ©es par le locuteur, la subjectivitĂ© dans la perception et lâappropriation des lieux, la subjectivitĂ© dans les recettes de cuisine et enfin la subjectivitĂ© exprimĂ©e Ă travers les noms gĂ©nĂ©raux
Les tribulations d'un nom propre en traduction (étude contrastive du nom propre et de sa traduction à partir d'un corpus aligné de dix langues européennes)
Les noms propres sont omniprésents et intéressent, depuis des siÚcles, philosophes et linguistes. Le travail réalisé ici est une étude contrastive des noms propres en traduction, divisée en quatre parties. Les deux premiÚres parties sont théoriques. La premiÚre partie traite de la notion de nom propre en linguistique anglaise et en linguistique française. La deuxiÚme partie présente les différents procédés de traduction, illustrés par des exemples sur les noms propres. Les deux parties suivantes sont expérimentales. La troisiÚme partie détaille les différentes étapes de la constitution de notre corpus multilingue parallÚle aligné et annoté, composé de onze versions du roman de Jules Verne, Le Tour du Monde en quatre-vingts jours, en dix langues européennes. La quatriÚme partie expose les résultats obtenus suite à l observation du comportement des noms propres en traduction.Cette étude contredit souvent l hypothÚse largement répandue de leur intraduisibilité.Proper names are omnipresent and have long held the interest of both philosophers and linguists.Our work, divided into four parts, presents, from a contrastive perspective, the behaviour of proper names in translation.The first two parts are theoretical. Firstly, we give a general presentation of what is a proper name from the point of view of both English and French linguistics. Secondly, we introduce the different translation processes proper nouns can undergo.The last two parts are experimental. We begin by explaining the different phases in the process of constitution of our aligned and annotated multilingual parallel corpus, composed of eleven versions of Jules Verne s novel, Le Tour du monde en quatre-vingts jours, in ten European languages. We then present the results obtained from the observation of proper names behaviour in translation.These results often contradict the widespread idea regarding proper names untranslatability.TOURS-Bibl.électronique (372610011) / SudocSudocFranceF
Exploration textuelle du discours d'un quotidien régional au carrefour du XIX<sup>e</sup> et du XX<sup>e</sup> siÚcles : <i>Le Petit Comtois</i> (1883-1903)
In contrast to topical trends of mediatic discourse analysis (predominantly focused on newspapers from the 21st century), this thesis aims at analyzing the discourse of a French newspaper called Le Petit Comtois (1883-1944). Rooted in various fields of research, namely corpus linguistics, âdiscourse analysis from a historical viewpointâ (Robin, Maldidier, Guilhaumou), âtextual analysis of discourseâ (Adam, Heidmann) and lexical statistics (Lebart, Salem), this thesis questions the contributions of a new numerical philology (Rastier; Viprey).This work is based on two complementary axes of research: on the one hand, we worked on the constitution of a textual database with the aim of accurately editing, controlling and normalizing it in order to allow for a revival of interdisciplinary studies led on regional 19th century newspapers. Therefore, our point is to propose some methodological approaches in order to overcome technical obstacles which occur during the acquisition and the sharing of large volume of textual data. The construction and the normalization of the database condition the heuristic confrontation of points of views and the choice of textual sciences methods for the analysis.On the other hand, our objectives are to highlight the specificities of Le Petit Comtois discourse during the period 1883-1903. Exploring a 5.5 million-word corpus, we mainly use the textual statistical methods to produce the emergence of the linguistic, textual and discursive reliefs of the text itself in order to use them as clues for the continuation of the analysis, with the aim to overtake the traditional entrance of the vocabulary used in lexicometry and its ways to approach textuality.Ă la diffĂ©rence des tendances actuelles de lâanalyse du discours mĂ©diatique, majoritairement tournĂ©e vers la presse nationale contemporaine, notre thĂšse vise un titre rĂ©gional du XIXe siĂšcle : Le Petit Comtois (1883-1944). Plongeant ses racines dans diffĂ©rents terreaux de recherche, Ă savoir la linguistique de corpus, lâanalyse du discours du cĂŽtĂ© de lâhistoire (Guilhaumou, Robin), la statistique textuelle (Lebart, Salem) et lâanalyse textuelle du discours (Adam, Heidmann), cette thĂšse interroge les apports dâune nouvelle philologie numĂ©rique (Rastier; Viprey, Mayaffre) se fixant pour programme de renforcer lâaccĂšs aux matĂ©rialitĂ©s discursives.Cette thĂšse articule ainsi deux axes de recherche complĂ©mentaires : dâune part, les conditions de la constitution dâune base de donnĂ©es textuelles finement Ă©tablies, contrĂŽlĂ©es et normalisĂ©es selon les recommandations XML-TEI, visant Ă favoriser le renouveau des lectures interdisciplinaires de la presse rĂ©gionale de la TroisiĂšme RĂ©publique (chapitre II).Il sâagit, ce faisant, de proposer des pistes mĂ©thodologiques en vue de la levĂ©e des obstacles techniques pesant sur lâacquisition et le partage de grands volumes de donnĂ©es textuelles, dont dĂ©pendent les avancĂ©es des sciences du texte. Partant, on replacera ces pistes dans la perspective des dĂ©bats thĂ©oriques contemporains en linguistique textuelle et linguistique de corpus.Dâautre part, notre objectif est dâapporter un Ă©clairage sur le discours du Petit Comtois sur la pĂ©riode 1883-1903 Ă partir dâun corpus de 5,5 millions de mots en articulant diverses mĂ©thodologies et niveaux dâanalyse, de sorte Ă apprĂ©hender dans toute son hĂ©tĂ©rogĂ©nĂ©itĂ© et sa complexitĂ© lâobjet texte. Si notre recherche sâappuie principalement sur les outils de la statistique textuelle qui permettent de faire monter du corpus lui-mĂȘme ses reliefs linguistiques, textuels, discursifs, envisagĂ©s comme des vecteurs dâexploration, elle vise Ă dĂ©passer la traditionnelle entrĂ©e du vocabulaire sur laquelle se fonde la lexicomĂ©trie, et ses modes dâapproche traditionnels sur cette entrĂ©e mĂȘme.Parce quâun texte est tout dâabord inscrit sur un support matĂ©riel signifiant, notre premier temps dâanalyse textuelle du discours du Petit Comtois (chapitre III) est ainsi consacrĂ© Ă lâanalyse de la mise en forme de lâinformation, telle quâelle se donne Ă lire Ă travers lâorganisation matĂ©rielle de lâaire scripturale (Peytard) et les niveaux dâorganisation que sont le rubriquage et le systĂšme de titres du quotidien.Plus quâun simple « chemin de fer » ayant pour fonction de catĂ©goriser lâinformation, le rubriquage constitue un des ressorts principaux de la rĂ©daction pour hiĂ©rarchiser lâinformation. Parce quâil rend compte des catĂ©gories par lesquelles le quotidien dĂ©coupe le monde, ce niveau constitue un lieu dâaccĂšs privilĂ©giĂ© Ă lâidentitĂ© du quotidien. Une analyse quantitative du rubriquage, mesurant la surface, lâemplacement topographique de chaque rubrique, sa frĂ©quence moyenne, nous a permis dâobserver, outre les thĂ©matiques principales du quotidien, les stratĂ©gies par lesquelles celui-ci hiĂ©rarchisait lâinformation. Ce volet dâanalyse nous a permis dâobserver que Le Petit Comtois, Ă lâinstar de la presse quotidienne rĂ©gionale de la TroisiĂšme RĂ©publique, fait la part belle aux Ă©vĂ©nements de portĂ©e nationale et internationale, ainsi quâĂ la vie politique de la TroisiĂšme RĂ©publique. Un examen linguistique des intitulĂ©s de rubrique du journal a pour sa part dĂ©montrĂ© la forte mise en valeur de la coĂŻncidence de la temporalitĂ© de lâimprimĂ© quotidien avec celle du monde, ainsi quâune forte persistance des liens avec la matrice littĂ©raire (ThĂ©renty), perceptible notamment Ă travers la prĂ©dominance des intitulĂ©s de rubrique rĂ©fĂ©rant Ă lâĂ©criture Ă©pistolaire.Notre intĂ©rĂȘt sâest ensuite portĂ© sur les titres du Petit Comtois, dont nous avons interrogĂ© les caractĂ©ristiques linguistiques et fonctionnelles, les variations et les rĂ©gularitĂ©s en diachronie. Celles-ci ont Ă©tĂ© analysĂ©es Ă partir de lâĂ©tude dâun sous-corpus substantiel de 6910 titres, extrait dâune des rares rubriques comportant des titres de façon permanente de 1883 Ă 1903 : les « dĂ©pĂȘches de nuit ». En premier lieu, au terme de lâanalyse, a Ă©tĂ© dĂ©gagĂ©e la fonction de classification de lâinformation dans un horizon thĂ©matique, gĂ©ographique ou historique assurĂ©e par les titres, au dĂ©triment dâune fonction dâannonce et de condensation de lâinformation principale de la dĂ©pĂȘche. En second lieu, dans cette rubrique emblĂ©matique du journalisme dâinformation inscrite dans un quotidien revendiquant sa fonction dâorgane porte-parole dâune sensibilitĂ© politique, les titres sont le lieu dâune coloration de lâinformation livrĂ©e par la voix du correspondant ou de lâagence Havas et donc des indices prĂ©cieux de lâethos discursif (Amossy) du quotidien : tout en exprimant sa lecture de lâactualitĂ©, Le Petit Comtois recourt Ă une parole railleuse et ludique, un certain franc-parler, visant Ă entretenir la connivence et la proximitĂ© avec son lecteur.Dans un second mouvement (chapitre IV), nous avons entrepris une sĂ©rie dâexplorations dans le vocabulaire du Petit Comtois, entendues comme le socle dâun parcours objectivĂ© du discours du journal. Une sĂ©rie de prise de vue sur le vocabulaire du Petit Comtois ont ainsi Ă©tĂ© constituĂ©es.Lâindex hiĂ©rarchique du corpus, analyse fort classique en lexicomĂ©trie, a livrĂ© une premiĂšre indication sur la consistance lexico-thĂ©matique du corpus, en confirmant notamment lâouverture du quotidien sur un horizon politique dont Paris est le cĆur gĂ©ographique et lâimportance de la temporalitĂ© dans Le Petit Comtois.Une seconde analyse, tout aussi classique en lexicomĂ©trie, a consistĂ© Ă examiner la ventilation du vocabulaire en diachronie (ou niveau macro-distributionnel) grĂące aux mĂ©thodologies de lâAFC : celle-ci a pointĂ© pour sa part une trĂšs nette division du corpus en deux sĂ©quences chronologiques distinctes : 1884-1896 dâune part, et 1897-1903 dâautre part. Lâanalyse des profils macro-distributionnels des items, associĂ©e Ă un mouvement de retour au texte, nous ont permis dâinterprĂ©ter ce clivage comme lâopposition entre une premiĂšre sĂ©quence marquĂ©e par un contexte colonialiste et revanchard ainsi que par les fameuses « affaires » politico-financiĂšres, et une sĂ©quence chronologique tĂ©moignant pour sa part dâun tournant radical et de lâintensification des dĂ©bats autour de la question sociale.Nous nous sommes ensuite tournĂ©e vers lâanalyse de la configuration fine du vocabulaire (niveau micro-distributionnel - Harris), mode dâaccĂšs privilĂ©giĂ© Ă la textualitĂ©-texture, Ă ses dimensions non linĂ©aires (tabulaires, rĂ©ticulaires), encore insuffisamment exploitĂ©es et conceptualisĂ©es. Lâanalyse micro-distributionnelle du vocabulaire du Petit Comtois a ainsi suggĂ©rĂ© que la configuration fine du vocabulaire sâorganisait autour de quatre pĂŽles isotropiques (Viprey), Ă consistance lexico-thĂ©matique voire rhĂ©torico-stylistique, Ă©voquant respectivement (1) les faits divers et leur passage en justice, (2) la vie lĂ©gislative, (3) les rĂ©seaux locaux de sociabilitĂ©s, et enfin, (4) le vocabulaire du politique, voire de lâidĂ©e rĂ©publicaine.Nous avons voulu observer lâĂ©volution diachronique de cette configuration fine en diachronie. De façon trĂšs stimulante, si lâon tient compte des rĂ©sultats livrĂ©s par lâexamen du niveau macro-distributionnel et de la nature du discours Ă©tudiĂ©, la structure fine du vocabulaire se rĂ©vĂšle extrĂȘmement stable en diachronie. De rares items tĂ©moignent dâune Ă©volution significative de leur co(n)texte dâune diachronie Ă une autre. Il est intĂ©ressant de remarquer que ceux-ci sont particuliĂšrement emblĂ©matiques des Ă©volutions socio-politiques dont prend acte la fin dâun trĂšs long XIXe siĂšcle. Câest notamment le cas de la forme ouvriers, dont lâĂ©volution trĂšs nette du profil collocatif marque celle de son sens. Dans un dernier temps, nous avons examinĂ© les facteurs responsables de la stabilitĂ© du rubriquage observĂ©e : lâanalyse des spĂ©cificitĂ©s des rubriques a ainsi rĂ©vĂ©lĂ© une forte corrĂ©lation entre le niveau du rubriquage et celle de la structure fine du vocabulaire. Lâinvariance des « motifs » lexicaux et stylistiques du quotidien nous suggĂšre donc que lâactualitĂ© et son essence prĂ©supposĂ©e « fluctuante », restent contrĂŽlĂ©es et organisĂ©es par les pratiques routiniĂšres journalistiques, renvoyant tant Ă la sĂ©lection de lâinformation quâĂ sa mise en scĂšne comme Ă©vĂ©nement. Enfin, un dernier temps de cette recherche (chapitre V) est dĂ©diĂ© Ă la consolidation dâune mĂ©thode de typologie en corpus, appliquĂ©e au classement des rubriques, basĂ©e sur le niveau morphosyntaxique. Ă la recherche dâune typologie discursive des rubriques du Petit Comtois, ce volet dâanalyse examine les vertus et les insuffisances dâun Ă©tiquetage automatique et explore les perspectives offertes par lâAFC en vue dâun dialogue continuĂ© avec les donnĂ©es. Devant ĂȘtre envisagĂ© comme le prĂ©alable Ă une analyse linguistique des genres journalistiques qui croiserait le niveau du vocabulaire et le niveau de la morphosyntaxe tout en tenant compte du plan compositionnel du texte (Bakhtine) grĂące Ă un encodage xml-tei, cet empan de nos recherches constitue une investigation mĂ©thodologique visant Ă se doter dâun protocole robuste et transparent dâanalyse.Ă la suite des travaux pionniers de Douglas Biber, de nombreuses Ă©tudes de typologie textuelle convoquent aujourdâhui le niveau morphosyntaxique. La logomĂ©trie, telle que dĂ©finie par D. Mayaffre, perçoit dâailleurs dans les progrĂšs de lâĂ©tiquetage automatique un renouvellement dĂ©cisif de lâanalyse des donnĂ©es textuelles. Cette position implique de sâaccommoder du taux dâerreur intrinsĂšque aux donnĂ©es issues dâun Ă©tiquetage automatique, dont lâinfluence est supposĂ©e modĂ©rĂ©e par la mĂ©thodologie statistique utilisĂ©e. Une analyse du discours soucieuse de la matĂ©rialitĂ© du texte ne peut nĂ©anmoins se satisfaire de ce taux dâerreur : entendant lâannotation morphosyntaxique comme un vĂ©ritable Ă©tat du texte, elle implique au contraire un Ă©tiquetage fin du niveau morphosyntaxique. Or, lâexpĂ©rience menĂ©e dans le cadre dâune entreprise typologique des rubriques du Petit Comtois montre que lâĂ©tiquetage automatique rĂ©alisĂ© par Cordial est loin dâĂȘtre suffisant pour rĂ©pondre Ă cette prĂ©tention : lâĂ©tiquetage opĂ©rĂ© reste un Ă©tiquetage « en langue », aux insuffisances duquel sâajoutent les limites du lexique interne de Cordial. On regrettera par ailleurs la pertinence discutable des catĂ©gories statiques de la grammaire traditionnelle convoquĂ©e par ce logiciel.En raison de ces insuffisances et en attendant de mener une contre-expĂ©rimentation basĂ©e sur un Ă©tiquetage fin et contrĂŽlĂ© de nos donnĂ©es, il nous semble ainsi devoir prendre quelques prĂ©cautions avec les rĂ©sultats obtenus de notre analyse, fort stimulants au demeurant. En effet, notre analyse des variables morphosyntaxiques dans les rubriques du Petit Comtois met au jour des facteurs trĂšs discriminants, parmi lesquels, dâune part, des variables assez inattendues (Ă lâinstar des dĂ©terminants dĂ©finis) et dâautre part, des facteurs faisant Ă©cho aux critĂšres gĂ©nĂ©riques journalistiques. On peut interprĂ©ter la configuration typologique des rubriques obtenue comme Ă©tant notamment fortement structurĂ©e par lâopposition entre les productions discursives Ă Ă©nonciation impliquĂ©e et les productions caractĂ©risĂ©es par un effacement Ă©nonciatif, configuration affinĂ©e par le degrĂ© de complexitĂ© des phrases et leur longueur. Le genre semble donc un « facteur » structurant de cette typologie, ce qui nous semble devoir ĂȘtre mis en lien avec la taille colossale du corpus Ă©tudiĂ© et la mĂ©thodologie statistique utilisĂ©, puisque lâAFC donne une reprĂ©sentation synthĂ©tique des tendances lourdes voire structurelles dâun ensemble de donnĂ©es. En lâoccurrence, le genre est cette tendance, qui, dans la lignĂ©e des postulats de lâanalyse du discours, sâavĂšre dĂ©terminant dans la typologisation des productions discursives journalistique du Petit Comtois
La "lexicologie explicative et combinatoire" dans le traitement des unités lexicales spécialisées
ThÚse diffusée initialement dans le cadre d'un projet pilote des Presses de l'Université de Montréal/Centre d'édition numérique UdeM (1997-2008) avec l'autorisation de l'auteur
Contribution à une étude des dysfonctionnements morphosyntaxiques en français chez un groupe d'enseignants et d'étudiants yéménites
French is the third language taught in Yemen after Arabic and English. This vitality of French requires the creation of didactic supports, in order to help in its learning. The purpose of the thesis is to highlight the areas of French, which are sources of difficulty for students, in terms of morphology and syntax, to classify and to describe them. The study of errors is based on two corpus of written work, one which has been done by thirty students in the fourth year of the license of the French Department of Thamar University, the other one by fifteen high school teachers, graduated in the same department. This study aims to introduce a reflection, in the French departments of the Yemenite universities, about strategies and objectives of the teaching of French as a language, in a non-French-speaking multilingual environment. It also aims to provide didactic resources for the study of the language to the teachers, trying to highlighting the priorities.Le français est la troisiĂšme langue enseignĂ©e au YĂ©men aprĂšs l'arabe et l'anglais. Cette vitalitĂ© du français nĂ©cessite la crĂ©ation de supports didactiques, afin d'aider Ă son apprentissage. L'objet de la thĂšse est de mettre en Ă©vidence les zones du français, qui sont sources de difficultĂ©s pour les Ă©tudiants tant sur le plan de la morphologie que sur celui de la syntaxe, de les classer et de les dĂ©crire. L'Ă©tude des erreurs s'appuiera sur deux corpus de travaux Ă©crits effectuĂ©s, l'un par trente Ă©tudiants de quatriĂšme annĂ©e de licence du dĂ©partement de français de l'universitĂ© de Dhamar, l'autre par quinze enseignants de lycĂ©e diplĂŽmĂ©s du mĂȘme dĂ©partement. Cette Ă©tude a pour finalitĂ© d'initier une rĂ©flexion, au sein des dĂ©partements de français des universitĂ©s yĂ©mĂ©nites, sur les stratĂ©gies et les objectifs de l'enseignement du français en tant que langue, dans un milieu plurilingue non francophone. Elle vise Ă©galement Ă offrir des ressources didactiques en matiĂšre d'Ă©tude de la langue aux enseignants, en tentant de mettant en Ă©vidence des prioritĂ©s
Analyse et représentation de la variation terminologique et de la multidimentionalité dans un thésaurus : le cas du métalangage de la terminologie
Le présent travail consiste à proposer un modÚle de représentation des notions
théoriques et pratiques de la terminologie et de leurs relations sous forme de thésaurus. Selon
la norme ISO 25964-1, 2011, « un thésaurus est un vocabulaire contrÎlé et structuré dans
lequel les concepts sont représentés par des termes, ayant été organisés afin de rendre
explicites les relations entre les concepts (âŠ) ». Notre objectif est de crĂ©er un outil
pĂ©dagogique Ă la suite dâune rĂ©flexion thĂ©orique englobant diffĂ©rentes perspectives
notionnelles au sein de cette discipline.
Les enjeux soulevés par la classification des concepts de certains champs de savoir
(notamment ceux donnant lieu Ă diffĂ©rentes perspectives) nâont pas Ă©tĂ© approfondis
suffisamment dans la littérature de la terminologie, ni dans celle portant sur les thésaurus.
Comment décrire des concepts qui sont sujets à des dissensions théoriques entre les différentes
écoles de pensée? Comment classer les différentes relations entretenues par les concepts
thĂ©oriques et les applications pratiques dâune discipline? Ă ces questions sâajoute celle de la
prise en compte de ces difficultés dans un thésaurus. Nous commençons par délimiter et
organiser les concepts saillants du domaine. Ensuite, Ă lâaide dâun corpus comprenant des
publications associées à différentes approches de la terminologie, nous étudions les
réalisations linguistiques de ces concepts et leurs relations en contexte, dans le but de les
dĂ©crire, de les classer et de les dĂ©finir. Puis, nous faisons lâencodage de ces donnĂ©es Ă lâaide
dâun logiciel de gestion de thĂ©saurus, en respectant les normes ISO applicables. La derniĂšre
étape consiste à définir la visualisation de ces données afin de la rendre conviviale et
compréhensible.
Enfin, nous présentons les caractéristiques fondamentales du Thésaurus de la
terminologie. Nous avons analysé et représenté un échantillon de 45 concepts et leurs termes
reliés. Les différents phénomÚnes associés à ces descripteurs comme la multidimensionalité, la
variation conceptuelle et la variation dénominative sont aussi représentés dans notre thésaurus.This thesis proposes a model to represent theoretical and practical concepts of terminology
as well as their terminological relationships in the form of a thesaurus. According to the ISO
25964-1:2011 standard, âa thesaurus is a controlled and structured vocabulary in which
concepts are represented by terms that have been previously arranged in order to show
explicitly the relations among concepts (âŠ)â. Our objective is to create a pedagogical tool that
is grounded in a theoretical reflection about different theoretical perspectives within this
discipline.
The issues associated with the classification of concepts in certain fields of knowledge
(especially those with different perspectives) require further study in the field of terminology
and information science, and in the literature relating to thesauri. Indeed, how does one
describe concepts that are subject to theoretical dissent and different schools of thought? How
can the different relationships between theoretical concepts and practical applications of a
discipline be classified? To these questions is added the additional challenge of reflecting
these difficulties in a thesaurus. Our first step consists in delimiting and organizing the main
concepts of the field. Then, by means of a corpus containing different publications associated
with different approaches in terminology, we study the linguistic realizations of those concepts
and their relationships in context, with the objective of describing, classifying and defining
them. We then encode this data using thesaurus management software that respects the
relevant ISO standards. Finally, we produce visualizations of this data to make it more user
friendly and understandable.
To conclude, we present the fundamental characteristics of the Thésaurus de la
terminologie. We have analyzed and presented a sample of 45 concepts and their related
terms. Different phenomena related to these descriptors, such as multidimensionality,
conceptual variation and denominative variation, are also represented in our thesaurus
Traduction des opérations de l'analyse historique dans le langage conceptuel des systÚmes d'information géographique pour une exploration des processus morphologiques de la ville et du territoire
Present work intends to conceive an interface between Urban Morphology and Geographic Information Science (GISc). This interface is considered as a space of exchange for knowledge exploration between several disciplines. The links pointed out from this theoretical work help us define the framework of formalization of morphological processes. We have focused our efforts over the methodology of translation of the notion of morphological process. The main steps of translation of the historical analysis operations into the conceptual language of the GISc mainly include numerical handling of cartographic sources, i.e. maps, plans, cadastre, etc. The main problems encountered are linked to the heterogeneity of historical information such as: partial data sets, non-representative statistical ensembles and semantic relativity of concepts through time (polysemy, synonymy, etc.). We discuss these problems from the knowledge production process point of view. We focus on questions of knowledge emergence from quantitative analysis and, symmetrically, of concept formalization leading to data structures compatible with the idea of characterization. Our work is essentially based on the possibilities of the exploratory paradigm applied to geo-historical data. By doing so, we have been particularly interested in the contributions of the systematic approach to the enhancement of the interpretive potential of classical descriptive morphological analyses. Outcome of work are of different natures. We can mention among others: 1° the construction of a formal classification (ontology) of concepts subsuming transformation and evolution of the city and the territory and 2° the development of an exploratory approach of geo-historical data. We have also discussed the contribution of some social sciences' paradigms (Callon and Latour's sociology of translation, Koselleck's conceptual history (Begriffsgeschichte), Peirce's abduction, Ginzburg's indiciary paradigm, etc.) to GISc. In particular, we are interested in the enhancement of the process of modeling by rethinking the tasks of conceptualization and formalization by taking into account the historical context of production of information during the process of knowledge reduction. We have pointed out the importance of periods of conceptual stability to allow comparative measurements and of events to explain ruptures not only at the data level, but also at the level of the entire conceptualization. These outputs should be considered as a new step towards recognition of the exploratory approach as a relevant tool to face interdisciplinary and complex problems related to urban processes in general. In particular, this work helps us stabilizing the theoretical framework contributing to the definition of the next generation numerical archives and interoperability of systems. Indeed, these technical questions need modelers to take into account different kinds of evolution when dealing with either concepts or instances and to produce a common platform to manage both. Finally, we show some clues to continue this work by introducing collaborative approaches and exploratory multidimensional interfaces. The figure below illustrates the initial framework of this research and the extension resulting from our work
Moyens informatiques de restitution en archéologie monumentale : cas du temple de Karnak
Lâobjectif de notre recherche est lâexploration et lâĂ©tude de la question de lâinstrumentation informatique des projets de reconstitution archĂ©ologiques en architecture monumentale dans le but de proposer de nouveaux moyens. La recherche a pour point de dĂ©part une question, Ă savoir : « Comment, et avec quels moyens informatiques, les projets de reconstitution architecturale pourraient-ils ĂȘtre menĂ©s en archĂ©ologie? ».
Cette question a nĂ©cessitĂ©, en premier lieu, une Ă©tude des diffĂ©rentes approches de restitution qui ont Ă©tĂ© mises Ă contribution pour des projets de reconstitution archĂ©ologiques, et ceci, Ă ses diffĂ©rentes phases. Il sâagit de comprendre lâĂ©volution des diffĂ©rentes mĂ©thodologies dâapproche (Ă©pistĂ©mologiquement) que les acteurs de ce domaine ont adoptĂ©es afin de mettre Ă contribution les technologies dâinformation et de communication (TIC) dans le domaine du patrimoine bĂąti. Cette Ă©tude nous a permis de dĂ©gager deux principales avenues: une premiĂšre qui vise exclusivement la « reprĂ©sentation » des rĂ©sultats des projets et une seconde qui vise la modĂ©lisation de ce processus dans le but dâassister lâarchĂ©ologue dans les diffĂ©rentes phases du projet. Nous dĂ©montrons que câest la deuxiĂšme approche qui permet la combinaison et met Ă la disposition des archĂ©ologues une meilleure exploitation des possibilitĂ©s que lâoutil informatique peut et pourra prĂ©senter. Cette partie permet de dĂ©montrer la nature systĂ©mique et complexe de la mise Ă contribution des TICs dans le domaine de la restitution archĂ©ologique. La multitude des acteurs, des conditions techniques, culturelles et autres, des moyens utilisĂ©s ainsi que la variĂ©tĂ© des objectifs envisagĂ©s dans les projets de reconstitution archĂ©ologiques poussent Ă explorer une nouvelle approche qui tient compte de cette complexitĂ©.
Pour atteindre notre objectif de recherche, la poursuite de lâĂ©tude de la nature de la dĂ©marche archĂ©ologique sâimpose. Il sâagit de comprendre les liens et les interrelations qui sâĂ©tablissent entre les diffĂ©rentes unitĂ©s techniques et intellectuelles en jeu ainsi que les diffĂ©rents modes de rĂ©flexions prĂ©sents dans les projets de reconstitution archĂ©ologique du patrimoine bĂąti. Cette Ă©tude met en Ă©vidence le rapport direct entre le caractĂšre subjectif de la dĂ©marche avec la grande variabilitĂ© des approches et des raisonnements mis en Ćuvre. La recherche est alors exploratoire et propositionnelle pour confronter notamment le caractĂšre systĂ©mique et complexe de lâexpĂ©rience concrĂšte et Ă travers les publications savantes, les Ă©lĂ©ments de la rĂ©alitĂ© connaissable. LâĂ©tude des raisonnements archĂ©ologiques Ă travers les publications savantes nous permet de proposer une premiĂšre typologie de raisonnements Ă©tudiĂ©s. Chacune de ces typologies reflĂšte une mĂ©thodologie dâapproche basĂ©e sur une organisation dâactions qui peut ĂȘtre consignĂ©e dans un ensemble de modules de raisonnements. Cette recherche fait ressortir, des phĂ©nomĂšnes et des processus observĂ©s, un modĂšle qui reprĂ©sente les interrelations et les interactions ainsi que les produits spĂ©cifiques de ces liaisons complexes. Ce modĂšle tĂ©moigne dâun processus rĂ©cursif, par essais et erreurs, au cours duquel lâacteur « expĂ©rimente » successivement, en fonction des objectifs de lâentreprise et Ă travers des modules de raisonnements choisis, plusieurs rĂ©ponses aux questions qui se posent Ă lui, au titre de la dĂ©finition du corpus, de la description, de la structuration, de lâinterprĂ©tation et de la validation des rĂ©sultats, jusquâĂ ce que cette derniĂšre lui paraisse satisfaire aux objectifs de dĂ©part.
Le modĂšle Ă©tabli est validĂ© Ă travers lâĂ©tude de cas du VIIĂšme pylĂŽne du temple de Karnak en Ăgypte. Les rĂ©sultats obtenus montrent que les modules de raisonnements reprĂ©sentent une solution intĂ©ressante pour assister les archĂ©ologues dans les projets de reconstitution archĂ©ologiques. Ces modules offrent une multiplicitĂ© de combinaisons des actions et avantagent ainsi une diversitĂ© dâapproches et de raisonnements pouvant ĂȘtre mis Ă contribution pour ces projets tout en maintenant la nature Ă©volutive du systĂšme global.The goal of our research is to explore and study the use of computerized tools in archaeological reconstruction projects of monumental architecture in order to propose new ways in which such technology can be used. The first question we ask is: "How and with which computerized tools can architectural reconstruction projects be conducted in archaeology?
In our quest to answer this question, we begin with a study of the different restitution approaches used in various phases of archaeological reconstruction projects. This involves understanding how the different methods of approach have evolved (epistemologically), how those involved in such projects have put information and communication technologies to use in the field of built heritage. This study has identified two main avenues: one whose sole aim is the "representation" of project results and another whose aim is to model this process in order to assist the archaeologist through various phases of a project. We have demonstrated that it is the second approach which combines and offers archaeologists a better utilization of the possibilities offered by computer assisted tools. This allowed us to demonstrate the complex and systemic nature of ICTâs in the field of archaeological reconstruction. The multiple actors, conditions, means and goals considered in archaeological reconstruction projects have led us to explore a new approach that reflects this complexity.
In order to achieve the goal of our research, it was necessary to further study the nature of the archaeological process. This involved understanding the links and interrelations between the various components that define the archaeological approach and the various thought processes involved in heritage building archaeological reconstruction projects. This study showed a direct relationship between the subjective nature of the process and the diversity of approaches and thought processes which can be implemented. This exploratory and propositional research reinforces the systemic and complex nature of our approach and prompts us to explore, in practice and through published literature, the elements of known reality. The study of archaeological reasoning through academic publications has allowed us to propose an initial typology of arguments studied. Each of these typologies reflects a methodological approach based on organized actions that can be recorded in a set of reasoning modules. This research has allowed us to highlight phenomena and observed processes, leading to a model representing interrelationships and interactions as well as the specific results of these complex interconnections. This pattern reflects a cyclical process of trial and error, in which the actors consecutively 'experience' (according to the projectâs goals and through reasoning modules), several answers to the questions exposed to him under the corpus definition, description, structure, interpretation and validation of the results until the latter would appear to meet the original targets.
The model developed was validated through a case study of the seventh pylon of the Karnak temple in Egypt. The results show that the reasoning modules offer an interesting solution assisting archaeologists in archaeological reconstruction projects. The multiple action combinations offered by these modules are an advantage to many approaches and thought processes which could be useful to such projects while maintaining the progressive nature of the overall system
- âŠ