387 research outputs found
Les constructions causatives avec mouvement en allemand : d'une saisie phraséologique à une explication constructionnelle
International audienceCet article propose une analyse constructionnelle de certaines structures de l'allemand (du type Sie sang das Kind in den Schlaf) en les situant par rapport aux constructions causatives avec mouvement (caused motion constructions) analysĂ©es en anglais par Goldberg (1995). La thĂšse centrale repose sur l'idĂ©e d'un continuum de causativitĂ© partant d'un cĂŽtĂ© de mini systĂšmes plus ou moins grammaticalisĂ©s et/ou lexicalisĂ©s (locutions Ă verbe fonctionnel) pour se clore sur des structures au premier abord difficilement explicables en termes de constructions rĂ©guliĂšres. La dĂ©monstration vise Ă mettre en Ă©vidence l'existence d'un schĂ©ma, relativement abstrait, commun aux diffĂ©rents types d'Ă©noncĂ©s envisagĂ©s qui, dans les cas les moins attendus et Ă premiĂšre vue les moins figĂ©s/lexicalisĂ©s, nĂ©cessite tout de mĂȘme de revenir aux notions de restrictions et, dans une certaine mesure, de figuration propres aux approches phrasĂ©ologiques classiques
Lexique, emprunts et invariants : une analyse théorique des anglicismes en français du Québec
Cet article traite de lâemprunt, Ă savoir les anglicismes en français du QuĂ©bec (FQ), dans le cadre dâune thĂ©orie grammaticale. Le programme minimaliste de Chomsky (1995) Ă©met lâhypothĂšse que la variation est restreinte aux parties non substantives du lexique et aux propriĂ©tĂ©s gĂ©nĂ©rales des Ă©lĂ©ments lexicaux. En dâautres termes, nous posons que les propriĂ©tĂ©s des catĂ©gories fonctionnelles de la grammaire crĂ©ditrice sont toujours exclues de cet Ă©change.Notre Ă©tude de cas porte sur lâĂ©tude du systĂšme du dĂ©terminant et du mot fun en FQ : câest lâfun/*it's the fun, on a eu un fun noir/*we had a black fun (on sâest follement amusĂ©s), c'est full fun/*it's full fun (câest trĂšs amusant). On y montre que les valeurs catĂ©gorielles doubles, en tant que N ou A attribuĂ©es exceptionnellement Ă ce mot dans la grammaire de lâanglais, se retrouvent Ă©galement en FQ, mais dâune façon totalement nouvelle, innovatrice.This article deals with borrowings, namely "anglicisms" in Quebec French (QF), within the framework of a grammatical theory. Chomsky's (1995) minimalist program hypothesizes that variation is limited to nonsubstantive parts of the lexicon and general properties of lexical items. In other words, I argue that the properties of functional categories in the borrowed grammar (English) are always excluded from this exchange.A more detailed study of the determiner system and of the borrowed word fun in QF is developed: câest lâfun/*it's the fun (it's fun), on a eu un fun noir/*we had a black fun (we had a lot of fun), câest full fun/*it's full fun (it's a lot of fun). It can be observed that the exceptional double categorizations of fun, as N or A in the grammar of English, can also be found in QF but in a totally new, innovative fashion
Génération modulaire de grammaires formelles
The work presented in this thesis aim at facilitating the development of resources for natural language processing. Resources of this type take different forms, because of the existence of several levels of linguistic description (syntax, morphology, semantics, . . . ) and of several formalisms proposed for the description of natural languages at each one of these levels. The formalisms featuring different types of structures, a unique description language is not enough: it is necessary to create a domain specific language (or DSL) for every formalism, and to implement a new tool which uses this language, which is a long a complex task. For this reason, we propose in this thesis a method to assemble in a modular way development frameworks specific to tasks of linguistic resource generation. The frameworks assembled thanks to our method are based on the fundamental concepts of the XMG (eXtensible MetaGrammar) approach, allowing the generation of tree based grammars. The method is based on the assembling of a description language from reusable bricks, and according to a unique specification file. The totality of the processing chain for the DSL is automatically assembled thanks to the same specification. In a first time, we validated this approach by recreating the XMG tool from elementary bricks. Some collaborations with linguists also brought us to assemble compilers allowing the description of morphology and semantics.Les travaux prĂ©sentĂ©s dans cette thĂšse visent Ă faciliter le dĂ©veloppement de ressources pour le traitement automatique des langues. Les ressources de ce type prennent des formes trĂšs diverses, en raison de lâexistence de diffĂ©rents niveaux dâĂ©tude de la langue (syntaxe, morphologie, sĂ©mantique,. . . ) et de diffĂ©rents formalismes proposĂ©s pour la description des langues Ă chacun de ces niveaux. Les formalismes faisant intervenir diffĂ©rents types de structures, un unique langage de description nâest pas suffisant : il est nĂ©cessaire pour chaque formalisme de crĂ©er un langage dĂ©diĂ© (ou DSL), et dâimplĂ©menter un nouvel outil utilisant ce langage, ce qui est une tĂąche longue et complexe. Pour cette raison, nous proposons dans cette thĂšse une mĂ©thode pour assembler modulairement, et adapter, des cadres de dĂ©veloppement spĂ©cifiques Ă des tĂąches de gĂ©nĂ©ration de ressources langagiĂšres. Les cadres de dĂ©veloppement crĂ©Ă©s sont construits autour des concepts fondamentaux de lâapproche XMG (eXtensible MetaGrammar), Ă savoir disposer dâun langage de description permettant la dĂ©finition modulaire dâabstractions sur des structures linguistiques, ainsi que leur combinaison non-dĂ©terministe (câest Ă dire au moyen des opĂ©rateurs logiques de conjonction et disjonction). La mĂ©thode se base sur lâassemblage dâun langage de description Ă partir de briques rĂ©utilisables, et dâaprĂšs un fichier unique de spĂ©cification. LâintĂ©gralitĂ© de la chaĂźne de traitement pour le DSL ainsi dĂ©fini est assemblĂ©e automatiquement dâaprĂšs cette mĂȘme spĂ©cification. Nous avons dans un premier temps validĂ© cette approche en recrĂ©ant lâoutil XMG Ă partir de briques Ă©lĂ©mentaires. Des collaborations avec des linguistes nous ont Ă©galement amenĂ© Ă assembler des compilateurs permettant la description de la morphologie de lâIkota (langue bantoue) et de la sĂ©mantique (au moyen de la thĂ©orie des frames)
Mise au point d'un formalisme syntaxique de haut niveau pour le traitement automatique des langues
The goal of computational linguistics is to provide a formal account linguistical knowledge, and to produce algorithmic tools for natural languageprocessing. Often, this is done in a so-called generative framework, where grammars describe sets of valid sentences by iteratively applying some set of rewrite rules. Another approach, based on model theory, describes instead grammaticality as a set of well-formedness logical constraints, relying on deep links between logic and automata in order to produce efficient parsers. This thesis favors the latter approach. Making use of several existing results in theoretical computer science, we propose a tool for linguistical description that is both expressive and designed to facilitate grammar engineering. It first tackles the abstract structure of sentences, providing a logical language based on lexical properties of words in order to concisely describe the set of grammaticaly valid sentences. It then draws the link between these abstract structures and their representations (both in syntax and semantics), through the use of linearization rules that rely on logic and lambda-calculus. Then in order to validate this proposal, we use it to model various linguistic phenomenas, ending with a specific focus on languages that include free word order phenomenas (that is, sentences which allow the free reordering of some of their words or syntagmas while keeping their meaning), and on their algorithmic complexity.La linguistique informatique a pour objet de construire un modĂšle formel des connaissances linguistiques, et dâen tirer des algorithmes permettant le traitement automatique des langues. Pour ce faire, elle sâappuie frĂ©quemment sur des grammaires dites gĂ©nĂ©ratives, construisant des phrases valides par lâapplication successive de rĂšgles de rĂ©Ă©criture. Une approche alternative, basĂ©e sur la thĂ©orie des modĂšles, vise Ă dĂ©crire la grammaticalitĂ© comme une conjonction de contraintes de bonne formation, en sâappuyant sur des liens profonds entre logique et automates pour produire des analyseurs efficaces. Notre travail se situe dans ce dernier cadre. En sâappuyant sur plusieurs rĂ©sultats existants en informatique thĂ©orique, nous proposons un outil de modĂ©lisation linguistique expressif, conçu pour faciliter lâingĂ©nierie grammaticale. Celui-ci considĂšre dans un premier temps la structure abstraite des Ă©noncĂ©s, et fournit un langage logique sâappuyant sur les propriĂ©tĂ©s lexicales des mots pour caractĂ©riser avec concision lâensemble des phrases grammaticalement correctes. Puis, dans un second temps, le lien entre ces structures abstraites et leurs reprĂ©sentations concrĂštes (en syntaxe et en sĂ©mantique) est Ă©tabli par le biais de rĂšgles de linĂ©arisation qui exploitent la logique et le lambda-calcul. Par suite, afin de valider cette approche, nous proposons un ensemble de modĂ©lisations portant sur des phĂ©nomĂšnes linguistiques divers, avec un intĂ©rĂȘt particulier pour le traitement des langages prĂ©sentant des phĂ©nomĂšnes dâordre libre (câest-Ă -dire qui autorisent la permutation de certains mots ou groupes de mots dans une phrase sans affecter sa signification), ainsi que pour leur complexitĂ© algorithmique
Mise au point d'un formalisme de haut niveau pour le traitement automatique des langues
The goal of computational linguistics is to provide a formal account linguistical knowledge, and to produce algorithmic tools for natural language processing. Often, this is done in a so-called generative framework, where grammars describe sets of valid sentences by iteratively applying some set of rewrite rules. Another approach, based on model theory, describes instead grammaticality as a set of well-formedness logical constraints, relying on deep links between logic and automata in order to produce efficient parsers. This thesis favors the latter approach.Making use of several existing results in theoretical computer science, we propose a tool for linguistical description that is both expressive and designed to facilitate grammar engineering. It first tackles the abstract structure of sentences, providing a logical language based on lexical properties of words in order to concisely describe the set of grammaticaly valid sentences. It then draws the link between these abstract structures and their representations (both in syntax and semantics), through the use of linearization rules that rely on logic and lambda-calculus.Then in order to validate this proposal, we use it to model various linguistic phenomenas, ending with a specific focus on languages that include free word order phenomenas (that is, sentences which allow the free reordering of some of their words or syntagmas while keeping their meaning), and on their algorithmic complexity.La linguistique informatique a pour objet de construire un modĂšle formel des connaissances linguistiques, et dâen tirer des algorithmes permettant le traitement automatique des langues. Pour ce faire, elle sâappuie frĂ©quemment sur des grammaires dites gĂ©nĂ©ratives, construisant des phrases valides par lâapplication successive de rĂšgles de rĂ©Ă©criture. Une approche alternative, basĂ©e sur la thĂ©orie des modĂšles, vise Ă dĂ©crire la grammaticalitĂ© comme une conjonctionde contraintes de bonne formation, en sâappuyant sur des liens profonds entre logique et automates pour produire des analyseurs efficaces. Notre travail se situe dans ce dernier cadre.En sâappuyant sur plusieurs rĂ©sultats existants en informatique thĂ©orique, nous proposons un outil de modĂ©lisation linguistique expressif, conçu pour faciliter lâingĂ©nierie grammaticale. Celui-ci considĂšre dans un premier temps la structure abstraite des Ă©noncĂ©s, et fournit un langage logique sâappuyant sur les propriĂ©tĂ©s lexicales des mots pour caractĂ©riser avec concision lâensemble des phrases grammaticalement correctes. Puis, dans un second temps, le lien entre ces structures abstraites et leurs reprĂ©sentations concrĂštes (en syntaxe et en sĂ©mantique) est Ă©tabli par le biais de rĂšgles de linĂ©arisation qui exploitent la logique et le lambda-calcul.Par suite, afin de valider cette approche, nous proposons un ensemble de modĂ©lisations portant sur des phĂ©nomĂšnes linguistiques divers, avec un intĂ©rĂȘt particulier pour le traitement des langages prĂ©sentant des phĂ©nomĂšnes dâordre libre (câest-Ă -dire qui autorisent la permutation de certains mots ou groupes de mots dans une phrase sans affecter sa signification), ainsi que pour leur complexitĂ© algorithmique
- âŠ