230 research outputs found

    Les disfluences dans les mots composés

    Get PDF
    National audienceLes disfluences, phénomène propre à l‟oral, ont la particularité de briser la linéarité syntaxique de l‟énoncé. Les mots composés ont tendance à former des unités syntaxiques et sémantiques. Dans cet article, nous montrons que l‟énonciation de telles expressions dans un discours oral est moins propice à l‟apparition de disfluences qu‟une séquence libre de mots. Pour cela, nous avons mis au point une procédure automatique de reconnaissance probabiliste des mots composés incluant une détection itérative préalable des disfluences

    De l’ambassadrice à la youtubeuse : ce que disent les dictionnaires de référence sur le féminin des noms d’agents

    Get PDF
    Dans cet article, nous analysons de façon systématique la manière dont Le Petit Robert et Le Petit Larousse intègrent et présentent le féminin des noms de professions, titres, grades et fonctions. En nous basant sur quelque 1700 noms de professions, on constate une description lexicographique différente entre ces deux ouvrages pour près de 30 % des formes.Notre attention se porte également sur des termes qui illustrent l’argumentaire des opposants à la féminisation : l’ambigüité née de l’homonymie entre un objet et un nom au féminin (cafetière) ou encore le féminin conjugal (l’ambassadrice serait la femme de l’ambassadeur et non la diplomate). En ce qui concerne la péjoration prétendument associée à certains noms féminins, on constate que les dictionnaires l’associent également au nom masculin.Néanmoins, on remarque que les dictionnaires mentionnent toujours de nombreux noms exclusivement au masculin, comme savant ou grand couturier.In this paper, we will analyze in a systematic fashion the way Le Petit Robert and Le Petit Larousse integrate and present the feminine form of the names of professions, titles, ranks and functions. By building on about 1700 names of professions, we notice a different lexicographical description between these two books for about 30% of the forms.Our attention also focus on terms wich illustrate the arguments of the opponents of the feminization: the ambiguity that arise from the homonymy between an object and a feminine name (cafetière), or even the conjugal feminine (l’ambassadrice being the ambassador’s wife and not the diplomat). As regards the negative characterization allegedly associated with certain feminine names, we note that both dictionnaries also associate it with the masculine name.However, we notice that dictionaries still mention numerous names exclusively in the masculine forme, as savant or grand couturier

    Le corpus de français parlé à Bruxelles:origines, hypothèses, développements et prédictions

    Get PDF
    This paper consists of an introduction of the new corpus of French as spoken in Brussels (CFPB) the initial phase of which has been fund by the BA/Leverhulme Small Research Grant Application: SG121252 Discourse on the city: Corpus of French as spoken in Brussels. We present here in turn: (1) the background of French in Brussels, (2) our research hypotheses and (3) their impact on the study design, We then mention (4) potential exploitations of the data collected before suggestions (5) future avenues for research

    La contribution des corpus oraux à la description de phénomènes de grammaticalisation:Que nous apprend le Corpus de français parlé à Bruxelles sur les périphrases en aller + infinitif?

    Get PDF
    En considérant les occurrences orales de différents emplois de la périphrase en aller + infinitif décrits par Bres et Labeau (2012a), cet article illustre la contribution positive des corpus oraux, et particulièrement du nouveau Corpus de français parlé à Bruxelles (CFPB) – au rassemblement d’occurrences authentiques de phénomènes linguistiques peu étudiés, au test de leurs descriptions théoriques, mais aussi à l’enrichissement de celles-ci.By studying oral tokens of different uses of the aller + infinitive periphrasis described in Bres & Labeau (2012a), this article illustrates the positive contribution of oral corpora –and particularly of the new Corpus de français parlé à Bruxelles– to the collection of authentic token of understudied linguistic phenomena, to the testing of their theoretical descriptions as well as the enrichment of those descriptions

    Les Rectifications de l’orthographe en Belgique francophone : de la politique linguistique aux pratiques des écoliers et de la presse

    Get PDF
    Cet article illustre différentes actions menées dans le cadre de la politique linguistique de la Fédération Wallonie-Bruxelles et qui touchent aux Rectifications de l’orthographe. Le Conseil de la langue française et de la politique linguistique de la Belgique francophone, avec le support de l’administration, conduit en effet, depuis sa création, une réflexion sur une langue plus appropriable, plus proche du citoyen. L’accès au monde de l’écrit, pour tous, a toujours été une de ses préoccupations majeures, et cet accès passe notamment par une orthographe plus rationnelle. C’est dans cette optique que les Rectifications de 1990 ont été l’objet de son attention, et que le Conseil a initié ou soutenu différentes actions de sensibilisation et des recherches sur le sujet. Dans cet article, nous en mentionnerons trois : une plaquette informative sur le contenu de la réforme, diffusée dans tous les établissements scolaires ; une campagne de sensibilisation auprès de la presse belge francophone avec la création d’un logiciel qui convertit les textes en nouvelle orthographe ; une étude sur les pratiques des élèves en fin de scolarité primaire. Nous verrons également, à travers l’analyse d’un corpus d’un million de mots, l’utilisation que fait aujourd’hui la presse belge des graphies rectifiées.This article illustrates various actions related to the reforms of the French orthography carried out in the context of the language policy of the Wallonia-Brussels Federation. Since its creation, the Council for the French Language and Language Policy of French-speaking Belgium, with the support of the administration, is engaged in a reflection on a more convenient language, closer to the citizen. Access to the written world, for everyone, has always been one of its major concerns, and this access requires, in particular, a more rational spelling. Therefore the 1990 Rectifications have been the subject of its attention, and the Council has initiated or supported various awareness-raising activities and research on this topic. In this article, we shall mention three of them: an information leaflet on the content of the reform, distributed in all schools; an awareness-raising campaign in the French-speaking Belgian press with the creation of software that converts texts into the new spelling; a study on the practices of pupils at the end of primary school. We will also discuss, through the analysis of a corpus of one million words, the use of rectified spellings by the Belgian press

    Députée européenne et fonctionnaire sanctionnatrice : 25 ans de politique linguis- tique en Belgique francophone pour la dénomination des femmes

    Get PDF
    Cet article fait le bilan de la politique linguistique menée depuis 25 ans en Belgique francophone au sujet de la féminisation des noms de professions. Après un historique des mesures institutionnelles prises en Francophonie nord, nous nous intéressons aux réactions virulentes qu’ont suscitées les prises de position officielles. Nous mettons en évidence l’argumentaire des opposants qui relève de la politique linguistique ainsi que les conditions favorables aux changements des pratiques. Parmi celles-ci, on trouve la publication de guides qui informent les citoyens. Nous abordons enfin le problème de l’écriture dite inclusive

    Rhapsodie: a Prosodic-Syntactic Treebank for Spoken French

    Get PDF
    International audienceThe main objective of the Rhapsodie project (ANR Rhapsodie 07 Corp-030-01) was to define rich, explicit, and reproducible schemes for the annotation of prosody and syntax in different genres (± spontaneous, ± planned, face-to-face interviews vs. broadcast, etc.), in order to study the prosody/syntax/discourse interface in spoken French, and their roles in the segmentation of speech into discourse units (Lacheret, Kahane, & Pietrandrea forthcoming). We here describe the deliverable, a syntactic and prosodic treebank of spoken French, composed of 57 short samples of spoken French (5 minutes long on average, amounting to 3 hours of speech and 33000 words), orthographically and phonetically transcribed. The transcriptions and the annotations are all aligned on the speech signal: phonemes, syllables, words, speakers, overlaps. This resource is freely available at www.projet-rhapsodie.fr. The sound samples (wav/mp3), the acoustic analysis (original F0 curve manually corrected and automatic stylized F0, pitch format), the orthographic transcriptions (txt), the microsyntactic annotations (tabular format), the macrosyntactic annotations (txt, tabular format), the prosodic annotations (xml, textgrid, tabular format), and the metadata (xml and html) can be freely downloaded under the terms of the Creative Commons licence Attribution - Noncommercial - Share Alike 3.0 France. The metadata are encoded in the IMDI-CMFI format and can be parsed on line

    tu veux couper là faut dire pourquoi - Propositions pour une segmentation syntaxique du français parlé

    Get PDF
    International audienceCet article s'intéresse à une question théorique majeure : la segmentation de transcriptions de français parlé en unités syntaxiques fondamentales. A ce jour, cette question n'a pas encore trouvé de réponse satisfaisante. Du côté de l'analyse syntaxique de l'écrit, on se tient habituellement à la ponctuation pour laquelle les pratiques sont relativement fluctuantes et n'obéissent pas à des critères stables. En effet, lorsque l'on ponctue un texte à l'écrit, on a vraisemblablement recours à des critères syntaxiques, sémantiques ou prosodiques (et d'autres encore) de façon variable selon les auteurs. Ce présupposé est donc déjà problématique pour l'analyse syntaxique de l'écrit. Mais pour l'oral spontané, la question se pose de manière encore plus aigüe en raison d'une architecture syntaxique moins bien connue et de l'absence de tradition unifiée de ponctuation, toutefois en partie compensée par les marqueurs prosodiques.Nous avons abordé la problématique de la segmentation syntaxique de manière pratique étant donné que notre étude se situe dans le cadre d'un projet d'annotation syntaxique et prosodique de français parlé, le projet ANR Rhapsodie . Dans ce papier, nous décrivons l'élaboration de critères reproductibles et opératoires utilisés pour la segmentation des transcriptions brutes du corpus Rhapsodie, critères qui ne prétendent pas régler l'ensemble des problèmes théoriques. Cette segmentation est la première étape indispensable pour une annotation syntaxique exhaustive et pour faciliter l'analyse syntaxique automatique des textes

    annoter du des textes tu te demandes si c'est syntaxique tu vois

    Get PDF
    International audienceRhapsodie est un projet de constitution d'un corpus de français parlé, annoté en prosodie et en syntaxe. Nous présentons ici les choix d'annotations syntaxiques spécifiques à l'oral ainsi que la stratégie d'annotation et les différents niveaux de représentation

    tu veux couper lĂ  faut dire pourquoi

    Full text link
    Cet article s’intéresse à une question théorique majeure : la segmentation de transcriptions de français parlé en unités syntaxiques. Nous avons abordé cette question de manière pratique dans le cadre d’un projet d’annotation syntaxique et prosodique de français parlé, le projet ANR Rhapsodie. Dans cet article, nous décrivons l’élaboration de critères reproductibles et opératoires utilisés pour la segmentation des transcriptions brutes du corpus. Dans un premier temps, nous présentons nos trois unités d’analyse, à savoir l’unité rectionnelle (UR), l’unité illocutoire (UI) et l’énoncé mais aussi ce qui nous a conduits à choisir trois unités maximales plutôt qu’une seule. Nous étudions ensuite différents types d’énoncés complexes, notamment les questions-réponses, l’instanciation, le discours rapporté, la greffe, le parallélisme entre énoncés ou encore les énoncés discontinus. Nous présentons la segmentation proposée et quelques-uns des problèmes que nous avons rencontrés au cours de l’élaboration du manuel d’annotation
    • …
    corecore