387 research outputs found

    Les constructions causatives avec mouvement en allemand : d'une saisie phraséologique à une explication constructionnelle

    No full text
    International audienceCet article propose une analyse constructionnelle de certaines structures de l'allemand (du type Sie sang das Kind in den Schlaf) en les situant par rapport aux constructions causatives avec mouvement (caused motion constructions) analysĂ©es en anglais par Goldberg (1995). La thĂšse centrale repose sur l'idĂ©e d'un continuum de causativitĂ© partant d'un cĂŽtĂ© de mini systĂšmes plus ou moins grammaticalisĂ©s et/ou lexicalisĂ©s (locutions Ă  verbe fonctionnel) pour se clore sur des structures au premier abord difficilement explicables en termes de constructions rĂ©guliĂšres. La dĂ©monstration vise Ă  mettre en Ă©vidence l'existence d'un schĂ©ma, relativement abstrait, commun aux diffĂ©rents types d'Ă©noncĂ©s envisagĂ©s qui, dans les cas les moins attendus et Ă  premiĂšre vue les moins figĂ©s/lexicalisĂ©s, nĂ©cessite tout de mĂȘme de revenir aux notions de restrictions et, dans une certaine mesure, de figuration propres aux approches phrasĂ©ologiques classiques

    Lexique, emprunts et invariants : une analyse théorique des anglicismes en français du Québec

    Get PDF
    Cet article traite de l’emprunt, Ă  savoir les anglicismes en français du QuĂ©bec (FQ), dans le cadre d’une thĂ©orie grammaticale. Le programme minimaliste de Chomsky (1995) Ă©met l’hypothĂšse que la variation est restreinte aux parties non substantives du lexique et aux propriĂ©tĂ©s gĂ©nĂ©rales des Ă©lĂ©ments lexicaux. En d’autres termes, nous posons que les propriĂ©tĂ©s des catĂ©gories fonctionnelles de la grammaire crĂ©ditrice sont toujours exclues de cet Ă©change.Notre Ă©tude de cas porte sur l’étude du systĂšme du dĂ©terminant et du mot fun en FQ : c’est l’fun/*it's the fun, on a eu un fun noir/*we had a black fun (on s’est follement amusĂ©s), c'est full fun/*it's full fun (c’est trĂšs amusant). On y montre que les valeurs catĂ©gorielles doubles, en tant que N ou A attribuĂ©es exceptionnellement Ă  ce mot dans la grammaire de l’anglais, se retrouvent Ă©galement en FQ, mais d’une façon totalement nouvelle, innovatrice.This article deals with borrowings, namely "anglicisms" in Quebec French (QF), within the framework of a grammatical theory. Chomsky's (1995) minimalist program hypothesizes that variation is limited to nonsubstantive parts of the lexicon and general properties of lexical items. In other words, I argue that the properties of functional categories in the borrowed grammar (English) are always excluded from this exchange.A more detailed study of the determiner system and of the borrowed word fun in QF is developed: c’est l’fun/*it's the fun (it's fun), on a eu un fun noir/*we had a black fun (we had a lot of fun), c’est full fun/*it's full fun (it's a lot of fun). It can be observed that the exceptional double categorizations of fun, as N or A in the grammar of English, can also be found in QF but in a totally new, innovative fashion

    Génération modulaire de grammaires formelles

    Get PDF
    The work presented in this thesis aim at facilitating the development of resources for natural language processing. Resources of this type take different forms, because of the existence of several levels of linguistic description (syntax, morphology, semantics, . . . ) and of several formalisms proposed for the description of natural languages at each one of these levels. The formalisms featuring different types of structures, a unique description language is not enough: it is necessary to create a domain specific language (or DSL) for every formalism, and to implement a new tool which uses this language, which is a long a complex task. For this reason, we propose in this thesis a method to assemble in a modular way development frameworks specific to tasks of linguistic resource generation. The frameworks assembled thanks to our method are based on the fundamental concepts of the XMG (eXtensible MetaGrammar) approach, allowing the generation of tree based grammars. The method is based on the assembling of a description language from reusable bricks, and according to a unique specification file. The totality of the processing chain for the DSL is automatically assembled thanks to the same specification. In a first time, we validated this approach by recreating the XMG tool from elementary bricks. Some collaborations with linguists also brought us to assemble compilers allowing the description of morphology and semantics.Les travaux prĂ©sentĂ©s dans cette thĂšse visent Ă  faciliter le dĂ©veloppement de ressources pour le traitement automatique des langues. Les ressources de ce type prennent des formes trĂšs diverses, en raison de l’existence de diffĂ©rents niveaux d’étude de la langue (syntaxe, morphologie, sĂ©mantique,. . . ) et de diffĂ©rents formalismes proposĂ©s pour la description des langues Ă  chacun de ces niveaux. Les formalismes faisant intervenir diffĂ©rents types de structures, un unique langage de description n’est pas suffisant : il est nĂ©cessaire pour chaque formalisme de crĂ©er un langage dĂ©diĂ© (ou DSL), et d’implĂ©menter un nouvel outil utilisant ce langage, ce qui est une tĂąche longue et complexe. Pour cette raison, nous proposons dans cette thĂšse une mĂ©thode pour assembler modulairement, et adapter, des cadres de dĂ©veloppement spĂ©cifiques Ă  des tĂąches de gĂ©nĂ©ration de ressources langagiĂšres. Les cadres de dĂ©veloppement crĂ©Ă©s sont construits autour des concepts fondamentaux de l’approche XMG (eXtensible MetaGrammar), Ă  savoir disposer d’un langage de description permettant la dĂ©finition modulaire d’abstractions sur des structures linguistiques, ainsi que leur combinaison non-dĂ©terministe (c’est Ă  dire au moyen des opĂ©rateurs logiques de conjonction et disjonction). La mĂ©thode se base sur l’assemblage d’un langage de description Ă  partir de briques rĂ©utilisables, et d’aprĂšs un fichier unique de spĂ©cification. L’intĂ©gralitĂ© de la chaĂźne de traitement pour le DSL ainsi dĂ©fini est assemblĂ©e automatiquement d’aprĂšs cette mĂȘme spĂ©cification. Nous avons dans un premier temps validĂ© cette approche en recrĂ©ant l’outil XMG Ă  partir de briques Ă©lĂ©mentaires. Des collaborations avec des linguistes nous ont Ă©galement amenĂ© Ă  assembler des compilateurs permettant la description de la morphologie de l’Ikota (langue bantoue) et de la sĂ©mantique (au moyen de la thĂ©orie des frames)

    Mise au point d'un formalisme syntaxique de haut niveau pour le traitement automatique des langues

    Get PDF
    The goal of computational linguistics is to provide a formal account linguistical knowledge, and to produce algorithmic tools for natural languageprocessing. Often, this is done in a so-called generative framework, where grammars describe sets of valid sentences by iteratively applying some set of rewrite rules. Another approach, based on model theory, describes instead grammaticality as a set of well-formedness logical constraints, relying on deep links between logic and automata in order to produce efficient parsers. This thesis favors the latter approach. Making use of several existing results in theoretical computer science, we propose a tool for linguistical description that is both expressive and designed to facilitate grammar engineering. It first tackles the abstract structure of sentences, providing a logical language based on lexical properties of words in order to concisely describe the set of grammaticaly valid sentences. It then draws the link between these abstract structures and their representations (both in syntax and semantics), through the use of linearization rules that rely on logic and lambda-calculus. Then in order to validate this proposal, we use it to model various linguistic phenomenas, ending with a specific focus on languages that include free word order phenomenas (that is, sentences which allow the free reordering of some of their words or syntagmas while keeping their meaning), and on their algorithmic complexity.La linguistique informatique a pour objet de construire un modĂšle formel des connaissances linguistiques, et d’en tirer des algorithmes permettant le traitement automatique des langues. Pour ce faire, elle s’appuie frĂ©quemment sur des grammaires dites gĂ©nĂ©ratives, construisant des phrases valides par l’application successive de rĂšgles de rĂ©Ă©criture. Une approche alternative, basĂ©e sur la thĂ©orie des modĂšles, vise Ă  dĂ©crire la grammaticalitĂ© comme une conjonction de contraintes de bonne formation, en s’appuyant sur des liens profonds entre logique et automates pour produire des analyseurs efficaces. Notre travail se situe dans ce dernier cadre. En s’appuyant sur plusieurs rĂ©sultats existants en informatique thĂ©orique, nous proposons un outil de modĂ©lisation linguistique expressif, conçu pour faciliter l’ingĂ©nierie grammaticale. Celui-ci considĂšre dans un premier temps la structure abstraite des Ă©noncĂ©s, et fournit un langage logique s’appuyant sur les propriĂ©tĂ©s lexicales des mots pour caractĂ©riser avec concision l’ensemble des phrases grammaticalement correctes. Puis, dans un second temps, le lien entre ces structures abstraites et leurs reprĂ©sentations concrĂštes (en syntaxe et en sĂ©mantique) est Ă©tabli par le biais de rĂšgles de linĂ©arisation qui exploitent la logique et le lambda-calcul. Par suite, afin de valider cette approche, nous proposons un ensemble de modĂ©lisations portant sur des phĂ©nomĂšnes linguistiques divers, avec un intĂ©rĂȘt particulier pour le traitement des langages prĂ©sentant des phĂ©nomĂšnes d’ordre libre (c’est-Ă -dire qui autorisent la permutation de certains mots ou groupes de mots dans une phrase sans affecter sa signification), ainsi que pour leur complexitĂ© algorithmique

    Mise au point d'un formalisme de haut niveau pour le traitement automatique des langues

    Get PDF
    The goal of computational linguistics is to provide a formal account linguistical knowledge, and to produce algorithmic tools for natural language processing. Often, this is done in a so-called generative framework, where grammars describe sets of valid sentences by iteratively applying some set of rewrite rules. Another approach, based on model theory, describes instead grammaticality as a set of well-formedness logical constraints, relying on deep links between logic and automata in order to produce efficient parsers. This thesis favors the latter approach.Making use of several existing results in theoretical computer science, we propose a tool for linguistical description that is both expressive and designed to facilitate grammar engineering. It first tackles the abstract structure of sentences, providing a logical language based on lexical properties of words in order to concisely describe the set of grammaticaly valid sentences. It then draws the link between these abstract structures and their representations (both in syntax and semantics), through the use of linearization rules that rely on logic and lambda-calculus.Then in order to validate this proposal, we use it to model various linguistic phenomenas, ending with a specific focus on languages that include free word order phenomenas (that is, sentences which allow the free reordering of some of their words or syntagmas while keeping their meaning), and on their algorithmic complexity.La linguistique informatique a pour objet de construire un modĂšle formel des connaissances linguistiques, et d’en tirer des algorithmes permettant le traitement automatique des langues. Pour ce faire, elle s’appuie frĂ©quemment sur des grammaires dites gĂ©nĂ©ratives, construisant des phrases valides par l’application successive de rĂšgles de rĂ©Ă©criture. Une approche alternative, basĂ©e sur la thĂ©orie des modĂšles, vise Ă  dĂ©crire la grammaticalitĂ© comme une conjonctionde contraintes de bonne formation, en s’appuyant sur des liens profonds entre logique et automates pour produire des analyseurs efficaces. Notre travail se situe dans ce dernier cadre.En s’appuyant sur plusieurs rĂ©sultats existants en informatique thĂ©orique, nous proposons un outil de modĂ©lisation linguistique expressif, conçu pour faciliter l’ingĂ©nierie grammaticale. Celui-ci considĂšre dans un premier temps la structure abstraite des Ă©noncĂ©s, et fournit un langage logique s’appuyant sur les propriĂ©tĂ©s lexicales des mots pour caractĂ©riser avec concision l’ensemble des phrases grammaticalement correctes. Puis, dans un second temps, le lien entre ces structures abstraites et leurs reprĂ©sentations concrĂštes (en syntaxe et en sĂ©mantique) est Ă©tabli par le biais de rĂšgles de linĂ©arisation qui exploitent la logique et le lambda-calcul.Par suite, afin de valider cette approche, nous proposons un ensemble de modĂ©lisations portant sur des phĂ©nomĂšnes linguistiques divers, avec un intĂ©rĂȘt particulier pour le traitement des langages prĂ©sentant des phĂ©nomĂšnes d’ordre libre (c’est-Ă -dire qui autorisent la permutation de certains mots ou groupes de mots dans une phrase sans affecter sa signification), ainsi que pour leur complexitĂ© algorithmique
    • 

    corecore