47 research outputs found
Ătude sur l'Ă©quivalence de termes extraits automatiquement d'un corpus parallĂšle : contribution Ă l'extraction terminologique bilingue
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal
Terminologie des techniques de décontamination des sols
L'objet de cette recherche a été d'établir et de définir une nomenclature des notions de base des techniques de décontamination des terrains, qui comptent parmi les moyens de réhabilitation environnementale. Le résultat des recherches terminologiques a été utilisé afin d'apporter une contribution au développement d'une banque terminologique disponible sur Internet. La méthodologie appliquée est celle de la recherche thématique bilingue : à partir d'un corpus de textes spécialisés, l'on a procédé à la constitution d'une nomenclature, qui a fait l'objet d'une recherche terminologique, tant en langue française qu'en langue anglaise. Les dossiers terminologiques ainsi élaborés ont été validés par un comité d'experts et intégrés sous forme de fiches au Grand dictionnaire terminologique, produit et mis en ligne par l'Office québécois de la langue française
TOTh 2010, Terminology & Ontology: Theories and applications
International audienceAvant proposCette annĂ©e la confĂ©rence a Ă©tĂ© prĂ©cĂ©dĂ©e dâune journĂ©e de formation consacrĂ©e Ă la terminologie et lâontologie, Ă leurs liens et leurs apports mutuels. LâintĂ©rĂȘt quâa suscitĂ© cette journĂ©e nous amĂšnera certainement Ă rĂ©itĂ©rer lâopĂ©ration les annĂ©es suivantes.Le succĂšs de la confĂ©rence dâouverture de notre collĂšgue FrĂ©dĂ©ric Nef, portant sur lâontologie prise dans sa dimension philosophique, a montrĂ©, sâil en Ă©tait encore besoin, la richesse dâune approche pluridisciplinaire.AnimĂ©es par diffĂ©rents prĂ©sidents, les sessions ont alternĂ© prĂ©sentations thĂ©oriques et dĂ©monstrations de systĂšmes, offrant ainsi lâopportunitĂ© Ă plusieurs industriels de nous parler de leurs projets. LâĂ©ventail des sujets abordĂ©s, Ă travers les quatorze prĂ©sentations retenues (incluant la confĂ©rence dâouverture) rĂ©parties sur deux jours, illustre la richesse mais aussi la vitalitĂ© de notre communautĂ© : aide Ă la traduction, thĂ©saurus multilingue, phrasĂ©ologie, entitĂ© nommĂ©, recherche dâinformation, etc. Lâ « actualitĂ© » nâĂ©tait pas oubliĂ©e Ă travers une ontologie des risques financiers.Enfin, les ConfĂ©rences TOTh sont devenues internationales Ă partir de cette annĂ©e avec le français et lâanglais comme langues officielles. Le comitĂ© de programme sâest ouvert Ă de nouveaux membres portant Ă dix le nombre de pays reprĂ©sentĂ©s et Ă plus de 40% le nombre de personnalitĂ©s Ă©trangĂšres. Gageons que cette ouverture sera prometteuse.Christophe RochePrĂ©sident du ComitĂ© Scientifiqu
Langages de l'architecture / architecture des langages : construction du sens dans le vocabulaire architectural
International audienceThe organization of the knowledges in the field of the architecture was arrested here in a historic and comparative aproach of the various speeches of the domain. We aproached this question within the framework of our current researches articulating architectural culture and documentary information. The reconstruction of the routes of elaboration of the documentary languages specialized in architecture allowed us to make striking meeting places and possible phenomena of distance arrested to reception of these linguistic representations. This exploratory work establishes the preliminary stage in researches on the practices of indexation in centres of resources in architecture.L'organisation des savoirs dans le domaine de l'architecture a été appréhendée ici dans une approche historique et comparative des différents discours du domaine. Nous avons abordé cette question dans le cadre de nos recherches actuelles articulant culture architecturale et information documentaire. La reconstitution des parcours d'élaboration des langages documentaires spécialisés en architecture nous a permis de rendre saillants les points de rencontres et les éventuels phénomÚnes d'écart appréhendés à réception de ces représentations langagiÚres. Ce travail exploratoire constitue l'étape préalable à des recherches sur les pratiques d'indexation dans des centres de ressources en architecture
Analyse comparative de l'Ă©quivalence terminologique en corpus parallĂšle et en corpus comparable : application au domaine du changement climatique
Les travaux entrepris dans le cadre de la prĂ©sente thĂšse portent sur lâanalyse de lâĂ©quivalence terminologique en corpus parallĂšle et en corpus comparable. Plus spĂ©cifiquement, nous nous intĂ©ressons aux corpus de textes spĂ©cialisĂ©s appartenant au domaine du changement climatique. Une des originalitĂ©s de cette Ă©tude rĂ©side dans lâanalyse des Ă©quivalents de termes simples. Les bases thĂ©oriques sur lesquelles nous nous appuyons sont la terminologie textuelle (Bourigault et Slodzian 1999) et lâapproche lexico-sĂ©mantique (LâHomme 2005).
Cette Ă©tude poursuit deux objectifs. Le premier est dâeffectuer une analyse comparative de lâĂ©quivalence dans les deux types de corpus afin de vĂ©rifier si lâĂ©quivalence terminologique observable dans les corpus parallĂšles se distingue de celle que lâon trouve dans les corpus comparables. Le deuxiĂšme consiste Ă comparer dans le dĂ©tail les Ă©quivalents associĂ©s Ă un mĂȘme terme anglais, afin de les dĂ©crire et de les rĂ©pertorier pour en dĂ©gager une typologie.
Lâanalyse dĂ©taillĂ©e des Ă©quivalents français de 343 termes anglais est menĂ©e Ă bien grĂące Ă lâexploitation dâoutils informatiques (extracteur de termes, aligneur de textes, etc.) et Ă la mise en place dâune mĂ©thodologie rigoureuse divisĂ©e en trois parties. La premiĂšre partie qui est commune aux deux objectifs de la recherche concerne lâĂ©laboration des corpus, la validation des termes anglais et le repĂ©rage des Ă©quivalents français dans les deux corpus. La deuxiĂšme partie dĂ©crit les critĂšres sur lesquels nous nous appuyons pour comparer les Ă©quivalents des deux types de corpus. La troisiĂšme partie met en place la typologie des Ă©quivalents associĂ©s Ă un mĂȘme terme anglais.
Les rĂ©sultats pour le premier objectif montrent que sur les 343 termes anglais analysĂ©s, les termes prĂ©sentant des Ă©quivalents critiquables dans les deux corpus sont relativement peu Ă©levĂ©s (12), tandis que le nombre de termes prĂ©sentant des similitudes dâĂ©quivalence entre les corpus est trĂšs Ă©levĂ© (272 Ă©quivalents identiques et 55 Ă©quivalents non critiquables). Lâanalyse comparative dĂ©crite dans ce chapitre confirme notre hypothĂšse selon laquelle la terminologie employĂ©e dans les corpus parallĂšles ne se dĂ©marque pas de celle des corpus comparables.
Les rĂ©sultats pour le deuxiĂšme objectif montrent que de nombreux termes anglais sont rendus par plusieurs Ă©quivalents (70 % des termes analysĂ©s). Il est aussi constatĂ© que ce ne sont pas les synonymes qui forment le groupe le plus important des Ă©quivalents, mais les quasi-synonymes. En outre, les Ă©quivalents appartenant Ă une autre partie du discours constituent une part importante des Ă©quivalents. Ainsi, la typologie Ă©laborĂ©e dans cette thĂšse prĂ©sente des mĂ©canismes de lâĂ©quivalence terminologique peu dĂ©crits aussi systĂ©matiquement dans les travaux antĂ©rieurs.The research undertaken for this thesis concerns the analysis of terminological equivalence in a parallel corpus and a comparable corpus. More specifically, we focus on specialized texts related to the domain of climate change. A unique aspect of this study is based on the analysis of the equivalents of single word terms. The theoretical frameworks on which we rely are the terminologie textuelle (Bourigault et Slodzian 1999) and the lexico-sĂ©mantique approaches (LâHomme 2005).
This study has two objectives. The first is to perform a comparative analysis of terminological equivalents in the two types of corpora in order to verify if the equivalents found in the parallel corpus are different from the ones observed in the comparable corpora. The second is to compare in detail equivalents associated with a same English term, in order to describe them and define a typology.
A detailed analysis of the French equivalents of 343 English terms is carried out with the help of computer tools (term extractor, text aligner, etc.) and the establishment of a rigorous methodology divided into three parts. The first part, common to both objectives of the research concerns the elaboration of the corpus, the validation of the English terms and the identification of the French equivalents in the two corpora. The second part describes the criteria on which we rely to compare the equivalents of the two types of corpora. The third part sets up the typology of equivalents associated with a same English term.
The results for the first objective shows that of the 343 English words analyzed, terms with equivalents that can be criticized in both corpora are relatively low in number (12), while the number of terms with similar equivalences between the two corpora is very high (272 identical and 55 equivalents not objectionable). The analysis described in this chapter confirms our hypothesis that terminology used in parallel corpora does not differ from that used in comparable corpora.
The results of the second objective show that many English terms are rendered by several equivalents (70% of analyzed terms). It is also noted that synonyms are not the largest group of equivalents but near-synonyms. Also, equivalents from another part of speech constitute an important part of the equivalents analyzed. Thus, the typology developed in this thesis presents terminological equivalent mechanisms rarely described as systematically in previous work
TOTh 2007 : Terminologie et Ontologie : Théories et Applications. Annecy 1er Juin 2007
National audienceProceedings of the TOTh 2007 Conference: Terminology and Ontology: Theories and Applications. Annecy, France 1st June 200
Terminologie de la langue de la proteÌomique
Being a brand-new domain, proteomics has never been the subject of any terminological work yet. This study aims to remedy the actual situation by presenting the results of a highly specialized thematic research on the vocabulary currently used by specialists. These results are presented within a bilingual English-French and a unilingual English terminological files. We hope that this study on proteomics will be the first of many others to come
TOTh 2011 Proceedings - Terminology & Ontology: Theories and applications
International audienceAvant-proposLa Terminologie est un domaine scientifique par nature pluridisciplinaire. Elle puise, entre autres, Ă la linguistique, la thĂ©orie de la connaissance, la logique. Pour que cette diversitĂ© soit une richesse, il faut lui offrir un cadre appropriĂ© au sein duquel elle puisse sâexprimer et sâĂ©panouir : câest une des raisons dâĂȘtre des ConfĂ©rences TOTh. Dans ce contexte, la formation et la transmission des connaissances jouent un rĂŽle essentiel. La Formation TOTh, programmĂ©e sur un jour et demi prĂ©cĂ©dant la confĂ©rence, se dĂ©roule depuis 2011 sur deux annĂ©es consĂ©cutives dĂ©diĂ©es pour lâune Ă la dimension linguistique et pour lâautre Ă la dimension conceptuelle de la terminologie, deux dimensions intimement liĂ©es. La Disputatio, introduite Ă partir de cette annĂ©e, renoue avec une forme dâenseignement et de recherche hĂ©ritĂ©e de la scolastique. Elle vise, Ă travers une lecture commentĂ©e effectuĂ©e par un membre du comitĂ© scientifique, Ă donner accĂšs Ă des textes jugĂ©s fondateurs de notre domaine, trop souvent oubliĂ©s voire ignorĂ©s.La cinquiĂšme Ă©dition des ConfĂ©rences TOTh a Ă©galement Ă©tĂ© lâoccasion de mettre en place un Prix « Jeune chercheur ». DĂ©cernĂ© par le comitĂ© scientifique lors de la confĂ©rence, il rĂ©compense le travail soumis Ă TOTh dâun de nos jeunes collĂšgues. Notre collĂšgue Michele Prandi, professeur Ă lâUniversitĂ degli Studi di Genova, a ouvert la ConfĂ©rence TOTh 2011 par un exposĂ© passionnant sur : « Signes, signifiĂ©s, concepts : pour un tournant philosophique en linguistique ». Le ton Ă©tait donnĂ©.Ont suivi douze communications (hors confĂ©rence dâouverture et disputatio) rĂ©parties sur deux jours en six sessions animĂ©es par diffĂ©rents prĂ©sidents. Elles ont permis dâaborder en profondeur â chaque intervention dure au minimum 45 minutes â de nombreux sujets tant thĂ©oriques que pratiques rappelant quâil ne peut y avoir de terminologie sans langue de spĂ©cialitĂ© ni savoir spĂ©cialisĂ©.Les douze communications, Ă©quitablement rĂ©parties sur les deux langues officielles de la confĂ©rence et provenant de sept pays diffĂ©rents, confirment lâaudience internationale acquise aujourdâhui par TOTh.Avant de vous souhaiter bonne lecture de ces actes, jâaimerais terminer en remerciant tous les participants de TOTh 2011 pour la richesse des dĂ©bats et des moments partagĂ©s. Christophe RochePrĂ©sident du comitĂ© scientifiqu
Lexique-grammaire et Unitex : quels apports pour une description terminologique bilingue de qualité ? : analyse sur deux corpus comparables de médecine thermale
Terminology is the science concerned with the study of the terms, those lexical units thatpossess a specialized meaning within a scientific or technical context. Established as ascience in the first half of 20th century, terminology is an interdisciplinary field takingadvantage of contributions from linguistics, logics, and informatics. This latter in particularhas allowed significant developments in terminology. Lexicon-grammar is an empirical method of linguistic description inspired by the works of Zellig S. Harris, which has been founded by the French linguist Maurice Gross at the end of the 1960s. Linguistic description has been carried out in parallel with the development of informatics tools able to formalise and exploit linguistic data, including the software Unitex (Paumier, 2002). Both lexicon-grammar and Unitex have an interesting, largely unexploited potential for further developments in terminology. In this work, we assess the contributions brought by lexicon-grammar and Unitex to a high-profile bilingual terminological description. After defining quality criteria for such terminological description, we carry out our evaluation on two comparable corpora specific of thermal medicine, both in French and in ItalianLa terminologie est une science qui étudie les termes, ces unités lexicales véhiculant un sens spécialisé dans un discours scientifique ou technique. Constituée en science dans la premiÚre moitié du XXe siÚcle, la terminologie est un terrain interdisciplinaire qui se nourrit des apports de la linguistique, de la logique et de l'informatique. C'est surtout grùce à cette derniÚre qu'elle a pu se développer considérablement. Le lexique-grammaire est une méthode de description linguistique strictement empirique d'inspiration harrissienne qui a vu le jour en France à la fin des années 1960. La description linguistique a été menée en parallÚle avec la réalisation d'outils informatiques nécessaires à la formalisation et à l'exploitation de ces données, parmi lesquels il y a aussi le logiciel Unitex (Paumier, 2002). Tant le lexique-grammaire que le logiciel Unitex présentent un potentiel intéressant, largement inexploité, pour la terminologie. Dans ce travail, nous nous proposons d'évaluer les apports des méthodes liées au lexique-grammaire et au logiciel Unitex à une description terminologique bilingue de qualité. AprÚs avoir défini des critÚres de qualité d'une description terminologique, nous menons cette évaluation sur deux corpus comparables ayant trait à la médecine thermale, en français et en italie