143 research outputs found

    Les dictionnaires d'orthographe : analyses et propositions

    Get PDF
    International audienceThis article, which is based on the analysis of twelve spelling dictionaries, aims at defining the finalities of this lexicographical genre. A distinction can be made between three types: 1) elementary dictionaries (word lists with brief indications); 2) supplementary dictionaries (brought out with other language guides); 3) annotated dictionaries (containing far more information than the first two types). This analysis shows that some areas are not covered and this could be rectified with a new type of dictionary, which would bring words out of their isolation by putting in many more cross-references, and thereby affording a more global and thus intelligible perspective on the way they are spelt. This sort of dictionary would greatly help users to understand and to master spelling.À partir de l'analyse d'une douzaine de titres, cet article tente de définir la problématique des dictionnaires d'orthographe. Trois types sont à distinguer : (1) les dictionnaires élémentaires (listes de mots assorties de brèves indications) : (2) les dictionnaires complémentaires (associés à des guides) ; (3) les dictionnaires commentés (beaucoup plus riches en informations). L'identification d'un certain nombre de lacunes conduit l'auteur à proposer un nouveau type de dictionnaire qui, en multipliant les renvois entre tous les types d'entrées, sortirait les mots de leur isolement et permettrait de percevoir les graphies de manière plus synthétique et plus intelligible. Un dictionnaire ainsi conçu pourrait contribuer efficacement à la compréhension et à la maîtrise de l'orthographe

    De l'incertitude en linguistique : le cas des variantes

    Get PDF
    La variation propre aux langues naturelles peut se manifester à tous les niveaux : phonétique, orthographe, morphologie, syntaxe. Il arrive aussi qu'elle interfère avec la sémantique, en cas d'homonymie ou de polysémie (répartition des formes en fonction des emplois). Mais ces phénomènes sont souvent décrits de manière imprécise et donnent lieu à de nombreuses contradictions. Cette étude plaide pour une approche plus rigoureuse, dans la perspective d'un traitement automatique des langues. L'informatique ne saurait se satisfaire de l'implicite ou de l'approximation. Tout comme l'incertitude en microphysique, le flou propre aux variantes peut et doit faire l'objet d'une représentation fine

    Domaines et classes sémantiques

    Get PDF
    This study examines the link between subject “fields” and semantic “classes”. After an explanation of the termes used, a two-pronged analysis is put forward. First, it appears that fields are heterogeneous sets, which can be analysed into finer semantic classes : this point is illustrated with three examples (verbs related to hairdressing, politics and numbers). But the reverse happens to be true : many classes can cross several fields. This means the two categories intersect and complete each other. Both prove to be useful for disambiguation, within the framework of automatic treatment of languages.Cette étude porte sur l'articulation entre les « domaines » d'activité et les « classes » sémantiques. Après une mise au point terminologique sur les deux termes en présence, une double démarche est proposée. On commence par établir, à partir de trois exemples (verbes relatifs à la coiffure, à la politique et aux nombres), que les domaines constituent des ensembles hétérogènes, analysables en classes sémantiques plus fines. Dans un deuxième temps, l'analyse montre que le rapport peut s'inverser : une même classe est susceptible de traverser plusieurs domaines. Cet entrecroisement des deux catégories fonde leur complémentarité. Elles sont toutes deux utiles pour la résolution des ambiguïtés, dans le cadre du traitement automatique des langues

    La majuscule flottante. Remarques sur l'orthographe des noms propres composés (type 'NAdj')

    Get PDF
    The use of capitals in proper nouns made up of Noun + Adjective is traditionally subject to extremely complex rules. Spelling textbooks do not agree on the detail of these rules, and an examination of current dictionaries (general language and proper nouns) shows wide-reaching discrepancies in the use of capitals (e.g. jeux olympiques, Jeux olympiques, jeux Olympiques, Jeux Olympiques). Two solutions are suggested. One is to unify the graphic form on a particular model (either Capital + small letters or Capital + Capital), the second is to accept the variations as equivalence classes.L'emploi des majuscules dans les noms propres de type Nom + Adjectif est traditionnellement soumise à des règles complexes. Les ouvrages de référence (dictionnaires orthographiques et autres guides du bon usage) ne donnent pas toujours les mêmes règles, et les dictionnaires usuels (langue générale et noms propres) font apparaître de nombreux désaccords. On trouve par exemple, selon les sources : jeux olympiques, Jeux olympiques, jeux Olympiques, Jeux Olympiques... Deux solutions sont proposées : unification des graphies autour d'un modèle cohérent (Majuscule + minuscule ou Majuscule + Majuscule) ou acceptation de toutes les variantes en tant que classes d'équivalence

    Syntaxe du trait d'union : Structures complexes

    Get PDF
    International audienceAmong the different values of the hyphen in French (typographical uses, grammatical uses, lexical uses, etc.), this study focuses on a specific set of complex patterns. Three models are developed : 1) correlative models, based on the particle mi- (mi-sérieux, mi-plaisant) ; 2) juxtaposed models, particularly the pattern N0 N1-N2 (l'opposition consonne-voyelles, le vol Paris-Londres), which allows a typological description based on the nature of the introductory term (N0) ; 3) double-compound models (conférence de presse-marathon, ex-homme de gauche), caracterized by a form of discrepancy between the morphological pattern and the graphic boundaries (*presse-marathon, *ex-homme). They can combine with the first two models (mi-salle de billard, mi-cabinet de travail ; l'interaction recherche fondamentale-recherche appliquée). These patterns are analysed with a view to an automatic treatment of hyphenated forms.Parmi les différents emplois du trait d'union en français (emplois typographiques, grammaticaux, lexicaux, etc.), il faut considérer un ensemble de structures complexes qui dépassent le cadre du mot. Trois modèles sont identifiés : 1) la corrélation, fondée sur la particule mi- (mi-sérieux, mi-plaisant) ; 2) la juxtaposition, et plus particulièrement la structure N0 N1-N2 (l'opposition consonne-voyelles, le vol Paris-Londres), qui permet une description typologique fondée sur la nature du terme introducteur (N0) ; 3) la surcomposition (conférence de presse-marathon, ex-homme de gauche), caractérisée par un désaccord entre la structure morphologique et les limites graphiques (*presse-marathon, *ex-homme). Elle peut se combiner avec les deux premiers modèles (mi-salle de billard, mi-cabinet de travail ; l'interaction recherche fondamentale-recherche appliquée). L'analyse de ces structures s'inscrit dans la perspective d'un traitement automatique des formes complexes

    Représentation de la polysémie dans un dictionnaire électronique

    Get PDF
    The traditional treatment of polysemy causes many problems of representation : the coexistence of several meanings within the same entry generates extremely complex structures, which are difficult for a computer to exploit. In developing electronic dictionaries, our suggestion would be to generalize and to systematize the splitting up (dégroupement) of the entries : it is better for each use to be considered as a full « word », i.e. to receive an independent address and a specific description (morphological, syntactic and semantic information, translations, etc.). The model allows as many descriptions as there are meanings. This does not necessarily leads to a dispersion of information : relations between the different uses (branchings, shifts in meaning...) can be reintroduced into appropriate fields, which allows a more flexible representation of polysemic connections. Our method can be summarized in this epistemological principle : 'distinguish to unite'.Le traitement traditionnel de la polysémie pose de nombreux problèmes de représentation : la coexistence de plusieurs emplois au sein d'un même article se traduit par des structures d'une grande complexité et difficiles à exploiter informatiquement. Travaillant à l'élaboration de dictionnaires électroniques, nous proposons de généraliser et de systématiser le dégroupement des entrées : chaque emploi gagne à être considéré comme un "mot" à part entière, ce qui revient à lui attribuer une adresse autonome et une description spécifique (rubriques morphologiques, syntaxiques et sémantiques, traductions, etc.). Le modèle prévoit autant de descriptions que de sens différents. Il n'en résulte pas nécessairement un émiettement de l'information : les relations entre les emplois (glissements de sens, arborescences, etc.), peuvent être réintroduites dans des champs appropriés, ce qui permet une représentation plus souple des connexions polysémiques. Défense et illustration d'un principe épistémologique : distinguer pour unir

    Flexion des noms et des adjectifs composés : principes de codage

    Get PDF
    Cette étude présente dans le détail un système de codage des noms et des adjectifs composés permettant de décrire, à partir de la liste des lemmes, toutes les formes fléchies correspondantes (mise au pluriel et, pour les adjectifs, au féminin). Il prend en compte la diversité des formes (plusieurs centaines de types morphologiques pour les noms composés) et la complexité de certains schémas flexionnels, notamment pour les mots à trait d'union (FRANCS-comtois mais FRANC-comtoises, arrière-GRAND-mères ou arrière-GRANDS-mères). Le système proposé se veut suffisamment flexible pour pouvoir prendre en charge tous les cas de figure

    Description de la langue de la médecine

    Get PDF
    http://www.erudit.org/revue/meta/2001/v46/n1/002976ar.pdfInternational audienc

    Essai de typologie des noms composés français

    Get PDF
    La description des noms composés se limite souvent à un petit nombre de classes morphologiques (préposition + nom, verbe + nom, nom + nom, nom + adjectif, etc.). Une analyse plus fine permet de mettre évidence, bien au contraire, l'extrême richesse des formes de composition. Dans cette étude, plus de 700 types sont identifiés, allant des formes les plus simples (par ex. les onomatopées : "du bla-bla") aux structures les plus complexes ("des pommes de terre en robe de chambre", "une lettre recommandée avec accusé de réception"). Ce niveau de précision est indispensable pour tout traitement approprié de la langue

    Concordanciers : Thème et variations

    Get PDF
    International audienceThe computation of a concordance is usually determined by three parameters : the word (or linguistic pattern) to be found, the size of the context given for each token, and the way the extracts should be sorted in order to facilitate the analysis. The power of this technic lies in the visual effects it creates by aligning and grouping the contexts through the centered-column presentation and the sorting of the lines. These principles can be generalized and extended : the pattern to be found can be decomposed into several zones, and each of them can be aligned as a column, or/and can be sorted.We illustrate these proposals by the implementation of a concordancer (KWAC-LLI) specialized for corpus linguistics in a distributional semantics approach. The corpus can be analysed according to four strategies, based on the syntagmatic or paradigmatic relation between predicates and arguments. The specialized concordancer tests two new features. The first one is a table which gives a global view of the concordance, with hypertext access to the detailed contexts. The second new feature is a linguistic sort, directly derived from the "classe d'objets" theory.Le calcul d'un concordancier se définit classiquement par trois paramètres : l'expression d'un pivot, la délimitation du contexte donné pour chaque occurrence relevée du pivot, et l'organisation des extraits par un tri facilitant le dépouillement. L'efficacité propre à cette technique tient essentiellement aux effets d'alignement et de regroupement issus de la présentation du pivot sur une colonne et des tris sur le pivot et son environnement. Nous proposons donc une généralisation de la technique des concordances avec l'articulation interne du pivot en plusieurs zones, focalisant et démultipliant les possibilités d'alignement et de tri.Nous prenons appui sur cette réflexion pour développer un concordancier (KWAC-LLI) adapté aux besoins linguistiques d'une sémantique distributionnelle, en l'occurrence la théorie des classes d'objets. Une combinatoire de quatre stratégies d'exploration de corpus peut être ainsi outillée, selon que l'on part de prédicats ou d'arguments pour rechercher d'autres prédicats ou d'autres arguments. Le concordancier s'enrichit dans ce contexte de deux innovations significatives : la présentation globale et synthétique des résultats sous forme de tableau hypertexte, et le tri des lignes du tableau traduisant directement un critère de pertinence linguistique donné par la théorie des classes d'objets
    corecore