51 research outputs found

    La compĂ©tence interprĂ©tative du locuteur dans le discours grammatical contextualisé : l’étude du genre des noms en français dans les grammaires du français conçues par les auteurs slovaques

    Get PDF
    L’objectif de l’article porte sur le processus interprĂ©tatif (le processus de perception et de comprĂ©hension) des locuteurs slovaques face aux phĂ©nomĂšnes grammaticaux du français. L’auteure pose que le discours grammatical contextualisĂ© peut ĂȘtre en partie influencĂ© par la compĂ©tence interprĂ©tative des locuteurs slovaques. Pour vĂ©rifier cette hypothĂšse, la premiĂšre partie de l’article expose briĂšvement la dĂ©finition et l’explication du concept linguistique de compĂ©tence interprĂ©tative que l’auteure tente de mettre en relation avec le processus d’apprentissage d’une langue Ă©trangĂšre ainsi qu’avec le discours grammatical contextualisĂ©. La deuxiĂšme partie de l’article se consacre Ă  l’analyse de la description grammaticale autour du genre des noms en français, ce qui lui permet de vĂ©rifier, dans un discours grammatical concret, la rĂ©flexion thĂ©orique prĂ©alable. Dans un premier temps, elle analyse le discours grammatical dans deux grammaires du français publiĂ©es en Slovaquie (FrancĂșzska gramatika, Taraba 2001 et Gramatika sĂșčasnej francĂșzĆĄtiny, Lingea 2011). Dans un second temps, l’auteure propose une description personnelle du genre des noms en français mettant en Ă©vidence le principe de la transparence morphosĂ©mantique qui rĂ©git le fonctionnement interne de la catĂ©gorie grammaticale du genre des noms en slovaque. Dans les deux situations, les formes de contextualisation observĂ©es sont dĂ©crites.This article deals with the interpretative process (the process of perception and understanding) of Slovak speakers as they face French grammatical phenomena. The author asserts that contextualized grammatical discourse can be partly affected by the interpretative competence of the Slovak speakers. To check this hypothesis, the first part of the article explores the definition and explanation of the linguistic concept of interpretative competence, which the author attempts to link to the learning process of the foreign language, as well as to contextualized grammatical discourse. The second part of the article focuses on the analysis of the grammatical description of the gender of nouns in French that helps to verify the previous theoretical reflection through a concrete grammatical discourse. First, the grammatical discourse in two French grammar books published in Slovakia (FrancĂșzska gramatika, Taraba 2001 and Gramatika sĂșčasnej francĂșzĆĄtiny, Lingea 2011) is analyzed. Second, the author proposes her own description of the gender of French nouns, highlighting the principle of morphological transparency, which governs the internal functioning of the grammatical category of noun gender in Slovak. In both situations, the observed forms of the contextualization are described

    Proposition d'un modĂšle relationnel d'indexation syntagmatique : mise en oeuvre dans le systĂšme iota

    No full text
    National audienceNous prĂ©sentons un modĂšle supportant une indexation Ă  base de syntagmes. Cette modĂ©lisation inclut une description formelle des termes d'indexation, un processus de dĂ©rivation, une fonction de correspondance, une sĂ©mantique du langage d'indexation et une fonction de pondĂ©ration de la orrespondance entre termes d'indexation. Elle met en Ă©vidence les Ă©lĂ©ments qui doivent permettre de guider la conception de SystĂšmes de Recherche d'Informations Ă  base de mots composĂ©s. Nous proposons Ă©galement un choix de techniques pour mettre en oeuvre ce modĂšle, particuliĂšrement dans l'extraction automatique des syntagmes et dans leur pondĂ©ration pour le calcul de la mesure pertinence d'un document par rapport Ă  une requĂȘte

    Extraction et Complétion de Terminologies Multilingues

    Get PDF
    Until now, automatic terminology extraction techniques have been often targeted towards monolingual corpora that are homogeneous from a language register point of view. This work, carried out in the context of a CIFRE convention, extends this objective to non-edited textual data written in typologically diverse languages, in order to extract « field terms ».This work focuses on the analysis of verbatim produced in the context of employee surveys carried out within multinational companies and processed by the Verbatim Analysis - VERA company. It involves the design and development of a processing pipeline for automatically extracting terminologies in a virtually language-independent, register-independent and domain-independent way.Based on an assessment of the typological properties of seven diverse languages, we propose a preliminary text pre-processing step prepares the training of models. This step is partly necessary (tokenization) and partly optional (removal of part of the morphological information). We compute from the resulting data a series of numerical features (statistical and frequency-based) used for training statistical models (CRFs).We select a first set of best models by means of an automatic dedicated evaluation of the extracted terms produced in each of the experimental settings considered for each languages. We then carry out a second series of evaluations for assessing the usability of these models on languages that differ from their training languages. Our results tend to demonstrate that the quality of the field terms that we extract is satisfying. The best scores we obtain (in a monolingual setting) are above 0, 9 for most languages. These scores can even be further improved for several languages by using some of the best models trained on other languages ; as a result, our approach could prove useful for extracting terminologies in languages for which such models are not available.Les processus d’extraction terminologique automatique ont Ă©tĂ© jusqu’ici majoritairement conçus pour ĂȘtre appliquĂ©s Ă  des corpus monolingues et dans des registres de langue uniformes. Cette thĂšse, rĂ©alisĂ©e dans le cadre d’une convention CIFRE, prolonge cet objectif pour une application Ă  des donnĂ©es textuelles bruitĂ©es et issues de langues de plus en plus variĂ©es, pour l’extraction de « termes de terrain ».Ce travail s’inscrit dans le cadre de l’analyse de verbatim issus d’enquĂȘtes internes au sein de multinationales traitĂ©es par l’entreprise Verbatim Analysis - VERA ; il consiste Ă  Ă©laborer une sĂ©quence de traitements pour l’extraction automatique de terminologies qui soit faiblement dĂ©pendante de la langue, du registre de langue ou du domaine.Suivant une rĂ©flexion fondĂ©e sur diffĂ©rents aspects de typologie linguistique appliquĂ©e Ă  sept langues, nous proposons des prĂ©traitements textuels prĂ©liminaires Ă  l’entraĂźnement de modĂšles. Ces derniers sont soit indispensables (segmentation en tokens), soit optionnels (amputation d’une partie de l’information morphologique). Sur l’ensemble des donnĂ©es ainsi produites, nous calculons des traits numĂ©riques(statistiques ou frĂ©quentiels) pour l’entraĂźnement des modĂšles statistiques de type CRF. Nous sĂ©lectionnons un ensemble de meilleurs modĂšles grĂące Ă  une Ă©valuation automatisĂ©e, au moyen d’une mĂ©trique adaptĂ©e, des termes extraits par les modĂšles produits pour l’ensemble des cadres expĂ©rimentaux envisagĂ©s pour chaque langue. Nous rĂ©alisons alors une seconde sĂ©rie d’évaluations pour Ă©tudier l’exploitabilitĂ© deces modĂšles pour d’autres langues que celles sur lesquelles ils ont Ă©tĂ© entraĂźnĂ©s. Il ressort de ces expĂ©riences que cette mĂ©thode aboutit Ă  une extraction de termes de terrain de qualitĂ© satisfaisante. Les meilleurs scores obtenus (pour une Ă©valuationmonolingue des modĂšles) se situent, pour la majoritĂ© des langues, au-dessus de l’iso-ligne de f-score 0, 9. Ces scores peuvent mĂȘme ĂȘtre amĂ©liorĂ©s pour certaines langues grĂące Ă  l’application trans-lingue des meilleurs modĂšles d’autres langues ; il en ressort que notre approche constitue potentiellement un bon levier Ă  des extractions terminologiques pour des langues ne disposant pas de leurs propres modĂšles.La seconde partie de notre travail prĂ©sente nos travaux relatifs Ă  la complĂ©tion automatique de terminologies structurĂ©es multilingues. Nous avons proposĂ© et Ă©valuĂ© deux algorithmes de complĂ©tion qui prennent en entrĂ©e un graphe de traduction multilingue (que nous construisons Ă  partir de ressources libres) et une terminologie multilingue structurĂ©e. Ils proposent alors de nouveaux candidats termes pour cette derniĂšre. Notre approche permet de complĂ©ter la terminologie structurĂ©e dans une langue qu’elle couvre dĂ©jĂ , mais Ă©galement d’étendre sa couverture Ă  de nou-velles langue. L’un de ces algorithmes est Ă©galement appliquĂ© au wordnet du français WOLF, ce qui en permet une amĂ©lioration importante de la couverture

    SxPipe 2: architecture pour le traitement pré-syntaxique de corpus bruts

    Get PDF
    International audienceCet article prĂ©sente SxPipe 2, chaĂźne modulaire et paramĂ©trable dont le rĂŽle est d'appliquer Ă  des corpus bruts une cascade de traitements de surface. PrĂ©alable nĂ©cessaire Ă  une possible analyse syntaxique, ils peuvent Ă©galement servir Ă  prĂ©parer d'autres tĂąches. DĂ©veloppĂ© pour le français mais Ă©galement pour d'autres langues, SxPipe 2 comprend, entre autres, divers modules de reconnaissances d'entitĂ©s nommĂ©es dans du texte brut, un segmenteur en phrases et en tokens, un correcteur orthographique et reconnaisseur de mots composĂ©s, ainsi qu'une architecture originale de reconnaissance de motifs non contextuels, utilisĂ©e par diffĂ©rentes grammaires spĂ©cialisĂ©es (nombres, constructions impersonnelles...). Nous prĂ©sentons les fondements thĂ©oriques des diffĂ©rents modules, leur mise en Ɠuvre pour le français et pour certains une Ă©valuation quantitative

    Les composés relationnels français du type relations parents-enfants

    Get PDF
    L’objectif de la prĂ©sente Ă©tude est d’analyser un Ă©chantillon reprĂ©sentatif des composĂ©s relationnels français du type « relations parents-enfants » extrait du corpus FrWac. Les composĂ©s relationnels comportent trois noms selon la structure N1 -N2a-N2b avec, d’une part, une relation subordonnĂ©e entre N1 et N2 et, d’autre part, une relation de coordination exocentrique entre N2a et N2b . L’analyse des donnĂ©es a permis de montrer que les composĂ©s relationnels français peuvent ĂȘtre dĂ©crits selon les mĂȘmes paramĂštres que les composĂ©s relationnels italiens, Ă  savoir : (a) la polyvalence / monovalence du nom-tĂȘte (N1 ); (b) la (non) autonomie du modifieur N2a-N2b; (c) le type de la relation subordonnĂ©e entre N1 et N2a-N2b; d) la nature de la relation de coordination entre N2a et N2b; et e) le fait que la relation entre N2a et N2b soit orientĂ©e ou non. Sur un plan plus gĂ©nĂ©ral, le cadre de la Morphologie constructionnelle nous a permis d’identifier dans les donnĂ©es trois principales sources qui motivent la crĂ©ation des composĂ©s relationnels, Ă  savoir : (a) la nature polyvalente du nom-tĂȘte; (b) le recours Ă  la structure binaire itĂ©rative avec un modificateur «dvandva»; et (c) la fusion de deux composĂ©s binominaux subordonnĂ©s en un seul composĂ© relationnel. À notre connaissance, ce dernier type n’a pas Ă©tĂ© mentionnĂ© dans les Ă©tudes prĂ©cĂ©dentes sur le sujet

    Les composés relationnels français du type relations parents-enfants

    Get PDF
    L’objectif de la prĂ©sente Ă©tude est d’analyser un Ă©chantillon reprĂ©sentatif des composĂ©s relationnels français du type « relations parents-enfants » extrait du corpus FrWac. Les composĂ©s relationnels comportent trois noms selon la structure N1 -N2a-N2b avec, d’une part, une relation subordonnĂ©e entre N1 et N2 et, d’autre part, une relation de coordination exocentrique entre N2a et N2b . L’analyse des donnĂ©es a permis de montrer que les composĂ©s relationnels français peuvent ĂȘtre dĂ©crits selon les mĂȘmes paramĂštres que les composĂ©s relationnels italiens, Ă  savoir : (a) la polyvalence / monovalence du nom-tĂȘte (N1 ); (b) la (non) autonomie du modifieur N2a-N2b; (c) le type de la relation subordonnĂ©e entre N1 et N2a-N2b; d) la nature de la relation de coordination entre N2a et N2b; et e) le fait que la relation entre N2a et N2b soit orientĂ©e ou non. Sur un plan plus gĂ©nĂ©ral, le cadre de la Morphologie constructionnelle nous a permis d’identifier dans les donnĂ©es trois principales sources qui motivent la crĂ©ation des composĂ©s relationnels, Ă  savoir : (a) la nature polyvalente du nom-tĂȘte; (b) le recours Ă  la structure binaire itĂ©rative avec un modificateur «dvandva»; et (c) la fusion de deux composĂ©s binominaux subordonnĂ©s en un seul composĂ© relationnel. À notre connaissance, ce dernier type n’a pas Ă©tĂ© mentionnĂ© dans les Ă©tudes prĂ©cĂ©dentes sur le sujet.This study aims to analyze a representative sample of French relational compounds such as “relations parents-enfants” (“parents-children relationship”) extracted from the FrWac corpus. Relational compounds have been defined as constructions made up of three nouns according to the structure N1 -N2a-N2b with, on the one hand, a subordinative relation between N1 and N2 and, on the other hand, an exocentric coordinative relation between N2a and N2b. The analysis of extensive data from the FrWac corpus made it possible to show that French relational compounds can be described according to the same parameters as Italian relational compounds, namely: (a) the polyvalence / monovalence of the head noun (N1 ); (b) the (non-)autonomy of the modifier N2a-N2b; (c) the type of the subordinate relationship between N1 and N2a-N2b; (d) the nature of the coordinative relationship between N2a and N2b; and (e) the fact whether the relationship between N2a and N2b is oriented or not. On a more general level, the framework of Construction morphology made it possible to identify in the data the following three principal sources which lie behind the creation of the relational compounds: (a) the polyvalent nature of the head noun; (b) the use of the iterative binary structure with a “dvandva” modifier; and (c) the fusion of two binominal subordinate compounds into a single relational compound. To the best of the author’s knowledge, the last type has not been mentioned in previous studies on the topic.13115

    NĂĄvrh, vytvoƙenĂ­ a vyuĆŸitĂ­ francouzskočeskĂ©ho a česko-francouzskĂ©ho paralelnĂ­ho korpusu

    Get PDF
    DisertačnĂ­ prĂĄce sestĂĄvĂĄ ze tƙí částĂ­, jeĆŸ odpovĂ­dajĂ­ nĂĄzvu. Autor nejprve pƙedstavuje koncepci paralelnĂ­ho korpusu a na obecnĂ© rovině jej definuje jakoĆŸto soubor textĆŻ v několika jazycĂ­ch (nejmĂ©ně dvou) tvoƙenĂœ dvojicemi originĂĄl-pƙeklad. Je uvedena terminologie pro pojmenovĂĄnĂ­ rĆŻznĂœch druhĆŻ textovĂœch souborĆŻ ve vĂ­ceru jazykĆŻ a k zĂ­skĂĄnĂ­ obecnĂ©ho pƙehledu v danĂ© oblasti se mohou čtenáƙi seznĂĄmit s paralelnĂ­mi korpusy, kterĂ© v současnĂ© době existujĂ­. NĂĄsledně je definovĂĄn francouzsko-českĂœ a česko-francouzskĂœ paralelnĂ­ korpus (Fratchque), a to vzhledem k jeho budoucĂ­mu pouĆŸitĂ­ pro jazykovědnĂœ vĂœzkum, zejmĂ©na k vyhledĂĄvĂĄnĂ­ nesklonnĂœch vĂœrazĆŻ, jeĆŸ pƙedstavujĂ­ autorĆŻv stƙed zĂĄjmu. Fratchque je paralelnĂ­ korpus beletristickĂœch textĆŻ psanĂœch francouzsky a česky; autor uvĂĄdĂ­ vĂœÄet obtĂ­ĆŸĂ­, jeĆŸ zamezily tomu, aby korpus obsahoval i jinĂ© druhy textĆŻ. Korpus existuje pouze v digitĂĄlnĂ­ podobě, aby umoĆŸnil vyhledĂĄvĂĄnĂ­ za pomoci počítače. SnaĆŸĂ­ se odrĂĄĆŸet modernĂ­ jazyk, proto obsahuje pouze texty, kterĂ© pochĂĄzejĂ­ z doby po roce 1945. Struktura souborĆŻ uloĆŸenĂœch na pevnĂ©m disku, jiĆŸ spravuje program ParaConc, mĆŻĆŸe bĂœt v budoucnu obohacena o novĂ© dvojice českofrancouzskĂœch či francouzsko-českĂœch textĆŻ. NenĂ­ explicitně označkovĂĄna XML značkami, coĆŸ je ospravedlněno tĂ­m, ĆŸe v současnĂ© době značkovĂĄnĂ­ nenĂ­ tƙeba; korpusovĂœ...According to the title, the thesis is composed of three parts. At the beginning the author introduces the concept of a parallel corpus defining it as a set of texts in different (at least two) languages, composed of original-translation couples. A terminology is provided to name different sets of texts in different languages. To have a general overview of this specific field, readers can be acquainted with the present existing parallel corpus. A definition of the project for creating a bidirectional French-Czech Czech-French parallel corpus is given in order to use it in linguistic research, notably research upon inflected expressions. French and Czech texts composing the parallel corpus Fratchque come from literature; the author also gives the explanation regarding the reason why other kinds of texts have not been taken into account. This corpus, conceived for PC-based researches, exists only in digital format. Having in mind the purpose of representing modern language, only texts after the year 1945 have been selected. New couples of French-Czech Czech-French texts could be easily added thanks to the files structure stored on a hard disk and managed by ParaConc. The corpus is not marked up explicitly by XML tags because the tagging is not necessary for the proper functioning of ParaConc - this step,...Institute of the Czech National CorpusÚstav českĂ©ho nĂĄrodnĂ­ho korpusuFilozofickĂĄ fakultaFaculty of Art

    FrancouzskĂ© pƙejĂ­mky z oblasti ƙemeslnĂ©ho pekaƙstvĂ­ a cukráƙstvĂ­ uĆŸĂ­vanĂ© v čeĆĄtině

    Get PDF
    The thesis deals with French loanwords from the field of artisanal baking and confectionery used in Czech. The theoretical part explores in more detail the concept of linguistic borrowings in general, in order to synthesize the knowledge of this phenomenon, which will be further developed in the second part of the thesis. It also specifies the history of the pastry and baking industry in France and in the Czech Republic. The aim of the practical part of the thesis is to determine the manner and form of use of selected loanwords from this field among native Czech speakers, with emphasis not only on the frequency of their use, but also on phonetic specifics related to their pronunciation. For this purpose, a sociolinguistic research in the form of a questionnaire and an interview is used.DiplomovĂĄ prĂĄce se zabĂœvĂĄ francouzskĂœmi pƙejĂ­mkami z oblasti ƙemeslnĂ©ho pekaƙstvĂ­ a cukráƙstvĂ­ uĆŸĂ­vanĂœmi v čeĆĄtině. TeoretickĂĄ část podrobněji zkoumĂĄ koncepci jazykovĂœch pƙejĂ­mek a vĂœpĆŻjček vĆĄeobecně, za Ășčelem syntĂ©zy poznatkĆŻ o tomto fenomĂ©nu, kterĂœ bude dĂĄle rozvinut ve druhĂ© části prĂĄce. BlĂ­ĆŸe takĂ© specifikuje historii cukráƙskĂ©ho a pekaƙskĂ©ho oboru ve Francii a v ČeskĂ© republice. CĂ­lem praktickĂ© části prĂĄce je zjistit zpĆŻsob a podobu uĆŸĂ­vĂĄnĂ­ vybranĂœch jazykovĂœch pƙejĂ­mek z tĂ©to oblasti mezi rodilĂœmi mluvčími čeĆĄtiny, s dĆŻrazem kladenĂœm nejen na frekvenci jejich pouĆŸitĂ­, ale takĂ© na fonetickĂĄ specifika souvisejĂ­cĂ­ s jejich vĂœslovnostĂ­. K tomuto Ășčelu je vyuĆŸito sociolingvistickĂ© ĆĄetƙenĂ­ v podobě dotaznĂ­ku a rozhovoru.Institute of Romance StudiesÚstav romĂĄnskĂœch studiĂ­FilozofickĂĄ fakultaFaculty of Art

    Que cachent les « termes barbares » de la crise financiÚre internationale ?

    Get PDF
    Avec la crise financiĂšre internationale, des termes, anglo-saxons pour la plupart, ont Ă©tĂ©Ì propulsĂ©s sur le devant de la scĂšne mĂ©diatique, obligeant les journalistes à un effort de vulgarisation, par le biais de stratĂ©gies explicatives de ces jargons incomprĂ©hensibles que constituent, pour le grand public, les terminologies. En ces lieux d’émergence, sur la chaine discursive, de « mots venus d’ailleurs », points de rencontre entre l’énonciateur (le journaliste-vulgarisateur) et les mots « de l’autre » (les termes des Ă©conomistes), viennent se glisser des commentaires mĂ©talinguistiques Ă©valuatifs du type « DerriĂšre ce nom barbare se cache... », « Connu sous le terme barbare de... », « Ce sigle barbare dĂ©signe... ». C’est sur cette « barbarie du terme », altĂ©ritĂ©Ì explicitement pointĂ©e, que cette contribution entend se pencher, Ă  travers la description des dispositifs de reformulation des termes Ă  l’intĂ©rieur desquels l’épithĂšte « barbare » est mobilisĂ©e, et l’analyse de la fonction discursive de cette derniĂšre.With the international financial crisis (2008), a series of primarily Anglo-Saxon terms began to be propelled to the forefront of the media. Journalists/commentors were thus forced to try to gloss and 'popularise' a highly specialised jargon that was incomprehensible for most of their audiences. Along the discursive chain of these 'words from elsewhere', which constituted the interface between the enunciator (journalist-divulgator) and the language of 'the Other' (the specialised economic terminology), a metalinguistic, evaluative commentary began to insinuate itself, e.g.: 'Hidden behind this barbaric term...', 'known by the barbaric term of...', 'this barbaric sigla designates...', etc. The present article examines the use of 'barbaric' as conferring a specific alterity to the terminology in question. It will do so by examining how terms defined or characterised in this way are specifically reformulated, and by analysing the discursive function of this characterisation

    LA PASSIVITÉ DE LA DYNAMIQUE MOTIVATIONNELLE DANS LA FORMATION DES VOCABULAIRES GASTRONOMIQUES FRANÇAIS

    Get PDF
    The study of role of motivation in the formation of new vocabulary and terminological units, taking into account the semantic relationship that exists between linguistic signs and their referents, is not new. This is an area that has generated lots of discussions and debates over the years. There have been various philosophical, sociological, linguistic and terminological arguments that motivation is indispensable in the course of word formation in French and that it exercises enormous influence on the referents of new words. However, there are other arguments that consider motivation as a non - factor in the formation of new words and in assigning meaning to them. This opposing view argues that motivation does not deserve a special place because the principle of arbitrariness of the linguistic signs is indisputable. In the present day, linguists and terminologists, for sociocultural and historical reasons, are still interested in linking a linguistic signifier to the referent, thereby reaffirming the role of motivation in words and their meaning. Hence scholars like Giraud (1967), Kocourek (1991) and Panculescu (2005) share the opinion that almost all French words are motivated, especially compound words. In this study, we are interested in the characteristics of words that are described as motivated. In many cases, some of these words are not completely motivated with respect to the semantic relationship that exists between the signifier and the referent. Many compound words are either partially motivated or are figuratively or idiomatically motivated. Therefore, arbitrariness does not disappear completely from these words, especially in French culinary terms which constitute our area of focus. This work will therefore look into this partial arbitrariness or passivity, taking into cognizance the consequences that may arise from their interpretation. We will proffer suggestions on the explanation of these arbitrary motivations in the formation of new words. To achieve this, we draw upon the theory of word formation in Thiele (1987) and the linguistico-terminological approach of CabrĂ© (1998) which both examine this phenomenon.Si chaque pays dispose de ses particularitĂ©s culinaires, qui manifestent son identitĂ©intrinsĂšque, il n’en va pas autrement chez les Français, lesquels vouent un culte aux plats etĂ  la cuisine. C’est une Ă©vidence qu’en France, manger reste un rituel du bonheur, et que, desurcroĂźt, tout se fait autour d’une table. Les moments solennels se passent souvent autourdes repas et l’abondance des plats fait Ă©cho Ă  l’envergure de l’évĂ©nement. Le plaisir demanger, il n’est point besoin de le rappeler, accompagne les repas et les hĂŽtes. CettesingularitĂ© non encore dĂ©mentie s’assortit de certaines rĂšgles de savoir-vivre, que l’onappelle le service Ă  la française
    • 

    corecore