51 research outputs found
La compĂ©tence interprĂ©tative du locuteur dans le discours grammatical contextualisĂ©Â : lâĂ©tude du genre des noms en français dans les grammaires du français conçues par les auteurs slovaques
Lâobjectif de lâarticle porte sur le processus interprĂ©tatif (le processus de perception et de comprĂ©hension) des locuteurs slovaques face aux phĂ©nomĂšnes grammaticaux du français. Lâauteure pose que le discours grammatical contextualisĂ© peut ĂȘtre en partie influencĂ© par la compĂ©tence interprĂ©tative des locuteurs slovaques. Pour vĂ©rifier cette hypothĂšse, la premiĂšre partie de lâarticle expose briĂšvement la dĂ©finition et lâexplication du concept linguistique de compĂ©tence interprĂ©tative que lâauteure tente de mettre en relation avec le processus dâapprentissage dâune langue Ă©trangĂšre ainsi quâavec le discours grammatical contextualisĂ©. La deuxiĂšme partie de lâarticle se consacre Ă lâanalyse de la description grammaticale autour du genre des noms en français, ce qui lui permet de vĂ©rifier, dans un discours grammatical concret, la rĂ©flexion thĂ©orique prĂ©alable. Dans un premier temps, elle analyse le discours grammatical dans deux grammaires du français publiĂ©es en Slovaquie (FrancĂșzska gramatika, Taraba 2001 et Gramatika sĂșÄasnej francĂșzĆĄtiny, Lingea 2011). Dans un second temps, lâauteure propose une description personnelle du genre des noms en français mettant en Ă©vidence le principe de la transparence morphosĂ©mantique qui rĂ©git le fonctionnement interne de la catĂ©gorie grammaticale du genre des noms en slovaque. Dans les deux situations, les formes de contextualisation observĂ©es sont dĂ©crites.This article deals with the interpretative process (the process of perception and understanding) of Slovak speakers as they face French grammatical phenomena. The author asserts that contextualized grammatical discourse can be partly affected by the interpretative competence of the Slovak speakers. To check this hypothesis, the first part of the article explores the definition and explanation of the linguistic concept of interpretative competence, which the author attempts to link to the learning process of the foreign language, as well as to contextualized grammatical discourse. The second part of the article focuses on the analysis of the grammatical description of the gender of nouns in French that helps to verify the previous theoretical reflection through a concrete grammatical discourse. First, the grammatical discourse in two French grammar books published in Slovakia (FrancĂșzska gramatika, Taraba 2001 and Gramatika sĂșÄasnej francĂșzĆĄtiny, Lingea 2011) is analyzed. Second, the author proposes her own description of the gender of French nouns, highlighting the principle of morphological transparency, which governs the internal functioning of the grammatical category of noun gender in Slovak. In both situations, the observed forms of the contextualization are described
Proposition d'un modĂšle relationnel d'indexation syntagmatique : mise en oeuvre dans le systĂšme iota
National audienceNous prĂ©sentons un modĂšle supportant une indexation Ă base de syntagmes. Cette modĂ©lisation inclut une description formelle des termes d'indexation, un processus de dĂ©rivation, une fonction de correspondance, une sĂ©mantique du langage d'indexation et une fonction de pondĂ©ration de la orrespondance entre termes d'indexation. Elle met en Ă©vidence les Ă©lĂ©ments qui doivent permettre de guider la conception de SystĂšmes de Recherche d'Informations Ă base de mots composĂ©s. Nous proposons Ă©galement un choix de techniques pour mettre en oeuvre ce modĂšle, particuliĂšrement dans l'extraction automatique des syntagmes et dans leur pondĂ©ration pour le calcul de la mesure pertinence d'un document par rapport Ă une requĂȘte
Extraction et Complétion de Terminologies Multilingues
Until now, automatic terminology extraction techniques have been often targeted towards monolingual corpora that are homogeneous from a language register point of view. This work, carried out in the context of a CIFRE convention, extends this objective to non-edited textual data written in typologically diverse languages, in order to extract « field terms ».This work focuses on the analysis of verbatim produced in the context of employee surveys carried out within multinational companies and processed by the Verbatim Analysis - VERA company. It involves the design and development of a processing pipeline for automatically extracting terminologies in a virtually language-independent, register-independent and domain-independent way.Based on an assessment of the typological properties of seven diverse languages, we propose a preliminary text pre-processing step prepares the training of models. This step is partly necessary (tokenization) and partly optional (removal of part of the morphological information). We compute from the resulting data a series of numerical features (statistical and frequency-based) used for training statistical models (CRFs).We select a first set of best models by means of an automatic dedicated evaluation of the extracted terms produced in each of the experimental settings considered for each languages. We then carry out a second series of evaluations for assessing the usability of these models on languages that differ from their training languages. Our results tend to demonstrate that the quality of the field terms that we extract is satisfying. The best scores we obtain (in a monolingual setting) are above 0, 9 for most languages. These scores can even be further improved for several languages by using some of the best models trained on other languages ; as a result, our approach could prove useful for extracting terminologies in languages for which such models are not available.Les processus dâextraction terminologique automatique ont Ă©tĂ© jusquâici majoritairement conçus pour ĂȘtre appliquĂ©s Ă des corpus monolingues et dans des registres de langue uniformes. Cette thĂšse, rĂ©alisĂ©e dans le cadre dâune convention CIFRE, prolonge cet objectif pour une application Ă des donnĂ©es textuelles bruitĂ©es et issues de langues de plus en plus variĂ©es, pour lâextraction de « termes de terrain ».Ce travail sâinscrit dans le cadre de lâanalyse de verbatim issus dâenquĂȘtes internes au sein de multinationales traitĂ©es par lâentreprise Verbatim Analysis - VERA ; il consiste Ă Ă©laborer une sĂ©quence de traitements pour lâextraction automatique de terminologies qui soit faiblement dĂ©pendante de la langue, du registre de langue ou du domaine.Suivant une rĂ©flexion fondĂ©e sur diffĂ©rents aspects de typologie linguistique appliquĂ©e Ă sept langues, nous proposons des prĂ©traitements textuels prĂ©liminaires Ă lâentraĂźnement de modĂšles. Ces derniers sont soit indispensables (segmentation en tokens), soit optionnels (amputation dâune partie de lâinformation morphologique). Sur lâensemble des donnĂ©es ainsi produites, nous calculons des traits numĂ©riques(statistiques ou frĂ©quentiels) pour lâentraĂźnement des modĂšles statistiques de type CRF. Nous sĂ©lectionnons un ensemble de meilleurs modĂšles grĂące Ă une Ă©valuation automatisĂ©e, au moyen dâune mĂ©trique adaptĂ©e, des termes extraits par les modĂšles produits pour lâensemble des cadres expĂ©rimentaux envisagĂ©s pour chaque langue. Nous rĂ©alisons alors une seconde sĂ©rie dâĂ©valuations pour Ă©tudier lâexploitabilitĂ© deces modĂšles pour dâautres langues que celles sur lesquelles ils ont Ă©tĂ© entraĂźnĂ©s. Il ressort de ces expĂ©riences que cette mĂ©thode aboutit Ă une extraction de termes de terrain de qualitĂ© satisfaisante. Les meilleurs scores obtenus (pour une Ă©valuationmonolingue des modĂšles) se situent, pour la majoritĂ© des langues, au-dessus de lâiso-ligne de f-score 0, 9. Ces scores peuvent mĂȘme ĂȘtre amĂ©liorĂ©s pour certaines langues grĂące Ă lâapplication trans-lingue des meilleurs modĂšles dâautres langues ; il en ressort que notre approche constitue potentiellement un bon levier Ă des extractions terminologiques pour des langues ne disposant pas de leurs propres modĂšles.La seconde partie de notre travail prĂ©sente nos travaux relatifs Ă la complĂ©tion automatique de terminologies structurĂ©es multilingues. Nous avons proposĂ© et Ă©valuĂ© deux algorithmes de complĂ©tion qui prennent en entrĂ©e un graphe de traduction multilingue (que nous construisons Ă partir de ressources libres) et une terminologie multilingue structurĂ©e. Ils proposent alors de nouveaux candidats termes pour cette derniĂšre. Notre approche permet de complĂ©ter la terminologie structurĂ©e dans une langue quâelle couvre dĂ©jĂ , mais Ă©galement dâĂ©tendre sa couverture Ă de nou-velles langue. Lâun de ces algorithmes est Ă©galement appliquĂ© au wordnet du français WOLF, ce qui en permet une amĂ©lioration importante de la couverture
SxPipe 2: architecture pour le traitement pré-syntaxique de corpus bruts
International audienceCet article prĂ©sente SxPipe 2, chaĂźne modulaire et paramĂ©trable dont le rĂŽle est d'appliquer Ă des corpus bruts une cascade de traitements de surface. PrĂ©alable nĂ©cessaire Ă une possible analyse syntaxique, ils peuvent Ă©galement servir Ă prĂ©parer d'autres tĂąches. DĂ©veloppĂ© pour le français mais Ă©galement pour d'autres langues, SxPipe 2 comprend, entre autres, divers modules de reconnaissances d'entitĂ©s nommĂ©es dans du texte brut, un segmenteur en phrases et en tokens, un correcteur orthographique et reconnaisseur de mots composĂ©s, ainsi qu'une architecture originale de reconnaissance de motifs non contextuels, utilisĂ©e par diffĂ©rentes grammaires spĂ©cialisĂ©es (nombres, constructions impersonnelles...). Nous prĂ©sentons les fondements thĂ©oriques des diffĂ©rents modules, leur mise en Ćuvre pour le français et pour certains une Ă©valuation quantitative
Les composés relationnels français du type relations parents-enfants
Lâobjectif de la prĂ©sente Ă©tude est dâanalyser un Ă©chantillon reprĂ©sentatif des composĂ©s relationnels
français du type « relations parents-enfants » extrait du corpus FrWac. Les composés relationnels
comportent trois noms selon la structure N1
-N2a-N2b avec, dâune part, une relation subordonnĂ©e
entre N1
et N2
et, dâautre part, une relation de coordination exocentrique entre N2a et N2b . Lâanalyse
des donnĂ©es a permis de montrer que les composĂ©s relationnels français peuvent ĂȘtre dĂ©crits selon
les mĂȘmes paramĂštres que les composĂ©s relationnels italiens, Ă savoir : (a) la polyvalence / monovalence
du nom-tĂȘte (N1
); (b) la (non) autonomie du modifieur N2a-N2b; (c) le type de la relation subordonnée
entre N1
et N2a-N2b; d) la nature de la relation de coordination entre N2a et N2b; et e) le fait que
la relation entre N2a et N2b soit orientée ou non. Sur un plan plus général, le cadre de la Morphologie
constructionnelle nous a permis dâidentifier dans les donnĂ©es trois principales sources qui motivent
la crĂ©ation des composĂ©s relationnels, Ă savoir : (a) la nature polyvalente du nom-tĂȘte; (b) le recours
à la structure binaire itérative avec un modificateur «dvandva»; et (c) la fusion de deux composés
binominaux subordonnés en un seul composé relationnel. à notre connaissance, ce dernier type
nâa pas Ă©tĂ© mentionnĂ© dans les Ă©tudes prĂ©cĂ©dentes sur le sujet
Les composés relationnels français du type relations parents-enfants
Lâobjectif de la prĂ©sente Ă©tude est dâanalyser un Ă©chantillon reprĂ©sentatif des composĂ©s relationnels
français du type « relations parents-enfants » extrait du corpus FrWac. Les composés relationnels
comportent trois noms selon la structure N1
-N2a-N2b avec, dâune part, une relation subordonnĂ©e
entre N1
et N2
et, dâautre part, une relation de coordination exocentrique entre N2a et N2b . Lâanalyse
des donnĂ©es a permis de montrer que les composĂ©s relationnels français peuvent ĂȘtre dĂ©crits selon
les mĂȘmes paramĂštres que les composĂ©s relationnels italiens, Ă savoir : (a) la polyvalence / monovalence
du nom-tĂȘte (N1
); (b) la (non) autonomie du modifieur N2a-N2b; (c) le type de la relation subordonnée
entre N1
et N2a-N2b; d) la nature de la relation de coordination entre N2a et N2b; et e) le fait que
la relation entre N2a et N2b soit orientée ou non. Sur un plan plus général, le cadre de la Morphologie
constructionnelle nous a permis dâidentifier dans les donnĂ©es trois principales sources qui motivent
la crĂ©ation des composĂ©s relationnels, Ă savoir : (a) la nature polyvalente du nom-tĂȘte; (b) le recours
à la structure binaire itérative avec un modificateur «dvandva»; et (c) la fusion de deux composés
binominaux subordonnés en un seul composé relationnel. à notre connaissance, ce dernier type
nâa pas Ă©tĂ© mentionnĂ© dans les Ă©tudes prĂ©cĂ©dentes sur le sujet.This study aims to analyze a representative sample of French relational compounds such as ârelations
parents-enfantsâ (âparents-children relationshipâ) extracted from the FrWac corpus. Relational
compounds have been defined as constructions made up of three nouns according to the
structure N1
-N2a-N2b with, on the one hand, a subordinative relation between N1
and N2
and, on the
other hand, an exocentric coordinative relation between N2a and N2b. The analysis of extensive data
from the FrWac corpus made it possible to show that French relational compounds can be described
according to the same parameters as Italian relational compounds, namely: (a) the polyvalence /
monovalence of the head noun (N1
); (b) the (non-)autonomy of the modifier N2a-N2b; (c) the type of
the subordinate relationship between N1
and N2a-N2b; (d) the nature of the coordinative relationship
between N2a and N2b; and (e) the fact whether the relationship between N2a and N2b is oriented or not.
On a more general level, the framework of Construction morphology made it possible to identify in
the data the following three principal sources which lie behind the creation of the relational compounds:
(a) the polyvalent nature of the head noun; (b) the use of the iterative binary structure with
a âdvandvaâ modifier; and (c) the fusion of two binominal subordinate compounds into a single relational
compound. To the best of the authorâs knowledge, the last type has not been mentioned in
previous studies on the topic.13115
NĂĄvrh, vytvoĆenĂ a vyuĆŸitĂ francouzskoÄeskĂ©ho a Äesko-francouzskĂ©ho paralelnĂho korpusu
DisertaÄnĂ prĂĄce sestĂĄvĂĄ ze tĆĂ ÄĂĄstĂ, jeĆŸ odpovĂdajĂ nĂĄzvu. Autor nejprve pĆedstavuje koncepci paralelnĂho korpusu a na obecnĂ© rovinÄ jej definuje jakoĆŸto soubor textĆŻ v nÄkolika jazycĂch (nejmĂ©nÄ dvou) tvoĆenĂœ dvojicemi originĂĄl-pĆeklad. Je uvedena terminologie pro pojmenovĂĄnĂ rĆŻznĂœch druhĆŻ textovĂœch souborĆŻ ve vĂceru jazykĆŻ a k zĂskĂĄnĂ obecnĂ©ho pĆehledu v danĂ© oblasti se mohou ÄtenĂĄĆi seznĂĄmit s paralelnĂmi korpusy, kterĂ© v souÄasnĂ© dobÄ existujĂ. NĂĄslednÄ je definovĂĄn francouzsko-ÄeskĂœ a Äesko-francouzskĂœ paralelnĂ korpus (Fratchque), a to vzhledem k jeho budoucĂmu pouĆŸitĂ pro jazykovÄdnĂœ vĂœzkum, zejmĂ©na k vyhledĂĄvĂĄnĂ nesklonnĂœch vĂœrazĆŻ, jeĆŸ pĆedstavujĂ autorĆŻv stĆed zĂĄjmu. Fratchque je paralelnĂ korpus beletristickĂœch textĆŻ psanĂœch francouzsky a Äesky; autor uvĂĄdĂ vĂœÄet obtĂĆŸĂ, jeĆŸ zamezily tomu, aby korpus obsahoval i jinĂ© druhy textĆŻ. Korpus existuje pouze v digitĂĄlnĂ podobÄ, aby umoĆŸnil vyhledĂĄvĂĄnĂ za pomoci poÄĂtaÄe. SnaĆŸĂ se odrĂĄĆŸet modernĂ jazyk, proto obsahuje pouze texty, kterĂ© pochĂĄzejĂ z doby po roce 1945. Struktura souborĆŻ uloĆŸenĂœch na pevnĂ©m disku, jiĆŸ spravuje program ParaConc, mĆŻĆŸe bĂœt v budoucnu obohacena o novĂ© dvojice ÄeskofrancouzskĂœch Äi francouzsko-ÄeskĂœch textĆŻ. NenĂ explicitnÄ oznaÄkovĂĄna XML znaÄkami, coĆŸ je ospravedlnÄno tĂm, ĆŸe v souÄasnĂ© dobÄ znaÄkovĂĄnĂ nenĂ tĆeba; korpusovĂœ...According to the title, the thesis is composed of three parts. At the beginning the author introduces the concept of a parallel corpus defining it as a set of texts in different (at least two) languages, composed of original-translation couples. A terminology is provided to name different sets of texts in different languages. To have a general overview of this specific field, readers can be acquainted with the present existing parallel corpus. A definition of the project for creating a bidirectional French-Czech Czech-French parallel corpus is given in order to use it in linguistic research, notably research upon inflected expressions. French and Czech texts composing the parallel corpus Fratchque come from literature; the author also gives the explanation regarding the reason why other kinds of texts have not been taken into account. This corpus, conceived for PC-based researches, exists only in digital format. Having in mind the purpose of representing modern language, only texts after the year 1945 have been selected. New couples of French-Czech Czech-French texts could be easily added thanks to the files structure stored on a hard disk and managed by ParaConc. The corpus is not marked up explicitly by XML tags because the tagging is not necessary for the proper functioning of ParaConc - this step,...Institute of the Czech National CorpusĂstav ÄeskĂ©ho nĂĄrodnĂho korpusuFilozofickĂĄ fakultaFaculty of Art
FrancouzskĂ© pĆejĂmky z oblasti ĆemeslnĂ©ho pekaĆstvĂ a cukrĂĄĆstvĂ uĆŸĂvanĂ© v ÄeĆĄtinÄ
The thesis deals with French loanwords from the field of artisanal baking and confectionery used in Czech. The theoretical part explores in more detail the concept of linguistic borrowings in general, in order to synthesize the knowledge of this phenomenon, which will be further developed in the second part of the thesis. It also specifies the history of the pastry and baking industry in France and in the Czech Republic. The aim of the practical part of the thesis is to determine the manner and form of use of selected loanwords from this field among native Czech speakers, with emphasis not only on the frequency of their use, but also on phonetic specifics related to their pronunciation. For this purpose, a sociolinguistic research in the form of a questionnaire and an interview is used.DiplomovĂĄ prĂĄce se zabĂœvĂĄ francouzskĂœmi pĆejĂmkami z oblasti ĆemeslnĂ©ho pekaĆstvĂ a cukrĂĄĆstvĂ uĆŸĂvanĂœmi v ÄeĆĄtinÄ. TeoretickĂĄ ÄĂĄst podrobnÄji zkoumĂĄ koncepci jazykovĂœch pĆejĂmek a vĂœpĆŻjÄek vĆĄeobecnÄ, za ĂșÄelem syntĂ©zy poznatkĆŻ o tomto fenomĂ©nu, kterĂœ bude dĂĄle rozvinut ve druhĂ© ÄĂĄsti prĂĄce. BlĂĆŸe takĂ© specifikuje historii cukrĂĄĆskĂ©ho a pekaĆskĂ©ho oboru ve Francii a v ÄeskĂ© republice. CĂlem praktickĂ© ÄĂĄsti prĂĄce je zjistit zpĆŻsob a podobu uĆŸĂvĂĄnĂ vybranĂœch jazykovĂœch pĆejĂmek z tĂ©to oblasti mezi rodilĂœmi mluvÄĂmi ÄeĆĄtiny, s dĆŻrazem kladenĂœm nejen na frekvenci jejich pouĆŸitĂ, ale takĂ© na fonetickĂĄ specifika souvisejĂcĂ s jejich vĂœslovnostĂ. K tomuto ĂșÄelu je vyuĆŸito sociolingvistickĂ© ĆĄetĆenĂ v podobÄ dotaznĂku a rozhovoru.Institute of Romance StudiesĂstav romĂĄnskĂœch studiĂFilozofickĂĄ fakultaFaculty of Art
Que cachent les « termes barbares » de la crise financiÚre internationale ?
Avec la crise financiĂšre internationale, des termes, anglo-saxons pour la plupart, ont Ă©tĂ©Ì propulsĂ©s sur le devant de la scĂšne mĂ©diatique, obligeant les journalistes aÌ un effort de vulgarisation, par le biais de stratĂ©gies explicatives de ces jargons incomprĂ©hensibles que constituent, pour le grand public, les terminologies. En ces lieux dâĂ©mergence, sur la chaine discursive, de « mots venus dâailleurs », points de rencontre entre lâĂ©nonciateur (le journaliste-vulgarisateur) et les mots « de lâautre » (les termes des Ă©conomistes), viennent se glisser des commentaires mĂ©talinguistiques Ă©valuatifs du type « DerriĂšre ce nom barbare se cache... », « Connu sous le terme barbare de... », « Ce sigle barbare dĂ©signe... ». Câest sur cette « barbarie du terme », altĂ©ritĂ©Ì explicitement pointĂ©e, que cette contribution entend se pencher, Ă travers la description des dispositifs de reformulation des termes Ă lâintĂ©rieur desquels lâĂ©pithĂšte « barbare » est mobilisĂ©e, et lâanalyse de la fonction discursive de cette derniĂšre.With the international financial crisis (2008), a series of primarily Anglo-Saxon terms began to be propelled to the forefront of the media. Journalists/commentors were thus forced to try to gloss and 'popularise' a highly specialised jargon that was incomprehensible for most of their audiences. Along the discursive chain of these 'words from elsewhere', which constituted the interface between the enunciator (journalist-divulgator) and the language of 'the Other' (the specialised economic terminology), a metalinguistic, evaluative commentary began to insinuate itself, e.g.: 'Hidden behind this barbaric term...', 'known by the barbaric term of...', 'this barbaric sigla designates...', etc. The present article examines the use of 'barbaric' as conferring a specific alterity to the terminology in question. It will do so by examining how terms defined or characterised in this way are specifically reformulated, and by analysing the discursive function of this characterisation
LA PASSIVITĂ DE LA DYNAMIQUE MOTIVATIONNELLE DANS LA FORMATION DES VOCABULAIRES GASTRONOMIQUES FRANĂAIS
The study of role of motivation in the formation of new vocabulary and terminological units, taking into account the semantic relationship that exists between linguistic signs and their referents, is not new. This is an area that has generated lots of discussions and debates over the years. There have been various philosophical, sociological, linguistic and terminological arguments that motivation is indispensable in the course of word formation in French and that it exercises enormous influence on the referents of new words. However, there are other arguments that consider motivation as a non - factor in the formation of new words and in assigning meaning to them. This opposing view argues that motivation does not deserve a special place because the principle of arbitrariness of the linguistic signs is indisputable. In the present day, linguists and terminologists, for sociocultural and historical reasons, are still interested in linking a linguistic signifier to the referent, thereby reaffirming the role of motivation in words and their meaning. Hence scholars like Giraud (1967), Kocourek (1991) and Panculescu (2005) share the opinion that almost all French words are motivated, especially compound words. In this study, we are interested in the characteristics of words that are described as motivated. In many cases, some of these words are not completely motivated with respect to the semantic relationship that exists between the signifier and the referent. Many compound words are either partially motivated or are figuratively or idiomatically motivated. Therefore, arbitrariness does not disappear completely from these words, especially in French culinary terms which constitute our area of focus. This work will therefore look into this partial arbitrariness or passivity, taking into cognizance the consequences that may arise from their interpretation. We will proffer suggestions on the explanation of these arbitrary motivations in the formation of new words. To achieve this, we draw upon the theory of word formation in Thiele (1987) and the linguistico-terminological approach of CabrĂ© (1998) which both examine this phenomenon.Si chaque pays dispose de ses particularitĂ©s culinaires, qui manifestent son identitĂ©intrinsĂšque, il nâen va pas autrement chez les Français, lesquels vouent un culte aux plats etĂ la cuisine. Câest une Ă©vidence quâen France, manger reste un rituel du bonheur, et que, desurcroĂźt, tout se fait autour dâune table. Les moments solennels se passent souvent autourdes repas et lâabondance des plats fait Ă©cho Ă lâenvergure de lâĂ©vĂ©nement. Le plaisir demanger, il nâest point besoin de le rappeler, accompagne les repas et les hĂŽtes. CettesingularitĂ© non encore dĂ©mentie sâassortit de certaines rĂšgles de savoir-vivre, que lâonappelle le service Ă la française
- âŠ