61 research outputs found

    Recherche de critères formels pour l'identification automatique des particules discursives

    Get PDF
    Nous nous intéresserons dans cette communication à un certain nombre de « marqueurs » d'unités discursives, (l'unité discursive sera définie ici comme une nouvelle construction grammaticale ou une nouvelle construction non canonique constituant une unité de communication complète, telle bof ou si je pouvais...) qui jouent un rôle important dans l'organisation du discours : particules discursives (bon, ben, là, quoi, etc.), connecteurs (mais, donc, parce que, aussi, etc.) et un certain nombre de locutions telles que de toute façon, en fin de compte, en définitive, etc. Chanet (2004) recense la terminologie extrêmement abondante qui a été proposée dans la littérature, et souligne le flou (voire l'aspect contradictoire) des définitions proposée

    L'analyse syntaxique de l'oral : problèmes et méthodes

    No full text
    National audienceCette étude expose les résultats de plusieurs mois de réflexion et d'expérimentation liées à la constitution d'un corpus oral de référence dans le cadre du projet d'évaluation des analyseurs syntaxiques Easy. La plupart des travaux sur l'analyse syntaxique automatique au cours des dernières décennies ont porté sur l'écrit, et l'on dispose de très peu de corpus oraux syntaxiquement annotés (à notre connaissance aucun pour le français). Or, de tels corpus seraient extrêmement intéressants, tant pour les études linguistiques, que pour l'évolution des technologies de la parole, dont les « modèles de langage » sont souvent mis au point à partir de textes écrits reflétant assez mal le langage parlé (par exemple le journal Le Monde). L'oral constitue un défi majeur pour l'analyse syntaxique, mais nous montrerons que les phénomènes que l'on y observe se retrouvent également pour beaucoup à l'écrit, même si c'est avec des fréquences moindres. Nous faisons donc l'hypothèse que l'étude de l'oral peut aussi amener quelque lumière dans les zones d'ombre, souvent négligées par commodité, de l'écrit

    Evaluating the pronunciation of proper names by four French grapheme-to-phoneme converters

    No full text
    International Speech Communication Association (Isca) - International Astronautical Federation.ISBN : 13 9781604234480.This article reports on the results of a cooperative evaluation of grapheme-to-phoneme (GP) conversion for proper names in French. This work was carried out within the framework of a general evaluation campaign of various speech and language processing devices, including text-to-speech synthesis. The corpus and the methodology are described. The results of 4 systems are analysed: with 12-20% word error rates on a list of 8,000 proper names, they give a fairly accurate picture of the progress achieved, the state-of-the-art and the problems still to be solved, in the domain of GP conversion in French. In addition, the resources and collected data will be made available to the scientific and industrial community, in order to be re-used in future bench-marks

    An Assessment Of Semantic Information Automatically Extracted From Machine Readable Dictionaries

    No full text
    In this paper we provide a quantitative evaluation of information automatically extracted from machine readable dictionaries. Our results show that for any one dictionary, 55-70% of the extracted information is garbled in some way. However, we show that these results can be dramatically reduced to about 6% by combining the information extracted from five dictionaries. It therefore appears that even if individual dictionaries are an unreliable source of semantic information, multiple dictionaries can play an important role in building large lexical-semantic databases

    Feature Structures and Database Theory

    No full text
    More and more often, computational linguists and language engineers need to manipulate large sets of feature structures which constitute real databases. Creating, updating, querying and in general, exploiting such linguistic databases is not an easy task, and it is desirable to have atone' disposal operators and languages for query and manipulation like (and if possible extending) those available for standard databases. The goal of this paper is to provide a database model for sets of feature structures, thus bridging the gap between the two fields, feature-structure theory and database theory, both of which are well-developed and well-formalized, but seem to have evolved in relatively separate communities. First, we show what feature structures have in common with, and how they differ from, the most classic data model, the relational model. We then formally define a database model for feature structures, and show how the standard operators of the relational data model can be general..
    corecore