14 research outputs found
à la croisée des discours littéraire et scientifique : La comparaison comme haute figure dialogique
International audienceCette Ă©tude se concentre sur le dialogue particuliĂšrement riche quâentretiennent au XIXe siĂšcle les discours scientifique et littĂ©raire, et plus prĂ©cisĂ©ment sur la convocation, au sein de la critique littĂ©raire, de tout un champ notionnel empruntĂ© aux sciences dites exactes (biologie, physique, chimie, botaniqueâŠ). La comparaison, souvent employĂ©e par la critique littĂ©raire pour positionner son propre Ă©noncĂ© par rapport Ă un Ă©noncĂ© scientifique, semble tenir un rĂŽle central dans cet appareillement des discours, captant et catalysant en quelque sorte le « dialogisme discursif » [ADAM, 2005] au niveau microscopique. Au cĆur de cette intertextualitĂ©, il sâagit de comprendre la portĂ©e analogique de la comparaison, ses fonctions et enjeux particuliers
Another Facet of Literary Similes : A Study of Noun+Colour Term Adjectives
Similes can be expressed not only by using comparatives but also through noun+colour term (CT) adjectives such as âlily-whiteâ or âhearse-blackâ. This work studies such adjectives in a corpus of British prose fiction from the 19th- and 20th-century in terms of their structure and context of use. More specifically, it seeks to determine how similes built with those adjectives differ from traditional colour similes as far their distribution and their stylistic usage are concerned. In addition, it proposes a framework to classify noun+CT adjectives based on their originality
Extraction et analyse automatique des comparaisons et des pseudo-comparaisons pour la détection des comparaisons figuratives
International audienceExtraction and automatic analysis of comparative and pseudo-comparative structures for simile detection. This article is focused on automatic simile detection and disambiguation. It describes an algorithm which uses syntactic chunks and handcrafted rules to extract and analyse similes in a given text. This algorithm, which was evaluated on a corpus of literary texts, performs better than a system based on dependency parsing.Le présent article s'intéresse à la détection et à la désambiguïsation des comparaisons figuratives. Il décrit un algorithme qui utilise un analyseur syntaxique de surface (chunker) et des rÚgles manuelles afin d'extraire et d'analyser les (pseudo-)comparaisons présentes dans un texte. Cet algorithme, évalué sur un corpus de textes littéraires, donne de meilleurs résultats qu'un systÚme reposant sur une analyse syntaxique profonde
Identifying sound descriptions in texts
International audienc
Construction automatique de lexiques thématiques
International audienceNous présentons Lexifield, un systÚme entiÚrement automatique et indépendant de la langue pour la construction de lexiques spécifiques à un domaineà partir de courtes listes de termes 1. Lexifield sappuie sur un modÚle de plongement lexical (word embedding), un dictionnaire de définitions et un dictionnaire de synonymes. Pour évaluer Lexifield, quatre lexiques ont été générés : unlexique en français pour le sujet son et trois lexiques en anglais pour les sujetssound, taste et odour. Les résultats ont confirmé ses bonnes performancespar rapport à dautres systÚmes de létat de lart
Lexifield: a system for the automatic building of lexicons by semantic expansion of short word lists
International audienceWe present Lexifield, a fully automatic language-independent system for building domain-specific lexicons from a short list of terms defining the domain. Lexifield relies on a pre-trained word embedding model, a definition dictionary and a dictionary of synonyms. To evaluate this system, four lexicons have been generated: one lexicon in French for the topic âsonâ (âsoundâ) and three lexicons in English for the topics âsoundâ, âtasteâ and âodourâ. As compared to other word embedding-based systems and a state-of-the-art sensorial lexicon, Sensicon, our system achieves better precision and recall on reference lists extracted from manually created resources such as Rogetâs Thesaurus
Annotation automatique des comparaisons figuratives dans les textes littéraires
This thesis tackles the problem of the automatic recognition of similes in literary texts written in English or in French and proposes a framework to describe them from a stylistic perspective. For the purpose of this study, a simile has been defined as a syntactic structure that draws a parallel between at least two entities, lacks compositionality and is able to create an image in the receiverâs mind.Three main points differentiate the proposed approach from existing ones: it is strongly influenced by cognitive and linguistic theories on similes and comparisons, it takes into consideration a wide range of markers and it can adapt to diverse syntactic scenarios. Concretely speaking, it relies on three interconnected modules: - a syntactic module, which extracts potential simile candidates and identifies their components using grammatical roles and a set of handcrafted rules, - a semantic module which separates creative similes from both idiomatic similes and literal comparisons based on the salience of the ground and semantic similarity computed from data automatically retrieved from machine-readable dictionaries;- and an annotation module which makes use of the XML format and gives among others information on the type of comparisons (idiomatic, perceptualâŠ) and on the semantic categories used.Finally, the two annotation tasks we designed show that the automatic detection of figuration in similes must take into consideration.Finally, the two annotation tasks we designed show that the automatic detection of figuration in similes must take into consideration a series of features among which salience, categorisation and the sentence syntax.Cette thĂšse aborde le problĂšme de la dĂ©tection automatique des comparaisons figuratives dans des textes littĂ©raires en prose Ă©crits en français ou en anglais et propose un canevas pour dĂ©crire ces comparaisons dâun point de vue stylistique. Une comparaison figurative correspond ici Ă toute structure syntaxique qui met en parallĂšle au moins deux entitĂ©s, dĂ©roge au principe de compositionnalitĂ© et crĂ©e une image mentale dans lâesprit de ceux Ă qui elle est destinĂ©e.Trois Ă©lĂ©ments principaux distinguent notre approche des travaux prĂ©cĂ©dents : son ancrage dans les thĂ©ories linguistiques et cognitives sur les comparaisons littĂ©rales et figuratives, sa capacitĂ© Ă gĂ©rer des marqueurs appartenant Ă diffĂ©rentes catĂ©gories grammaticales et sa flexibilitĂ© qui lui permet dâenvisager diffĂ©rents scĂ©narios syntaxiques. De fait, nous proposons une mĂ©thode comprenant trois modules complĂ©mentaires : - un module syntaxique qui utilise des dĂ©pendances syntaxiques et des rĂšgles manuelles pour identifier les comparaisons potentielles ainsi que leurs composantes ;- un module sĂ©mantique qui mesure la saillance des motifs dĂ©tectĂ©s et la similaritĂ© sĂ©mantique des termes comparĂ©s en se basant sur une base de donnĂ©es prĂ©Ă©tablie ;- et un module dâannotation qui fournit entre autres des informations sur le type de comparaison (idiomatique, sensorielleâŠ) et sur les catĂ©gories sĂ©mantiques employĂ©es.Pour finir, au vu des donnĂ©es recueillies au cours des deux campagnes dâannotation que nous avons menĂ©es, il paraĂźt clair que la dĂ©tection automatique des comparaisons figuratives doit tenir compte de plusieurs facteurs parmi lesquels la saillance, la catĂ©gorisation et la syntaxe de la phrase
DĂ©couvrez et comparez les rĂ©sultats de Calliope, IramuteQ, TXM, Gargantext Ă partir dâun corpus de RetroNews
National audienceAtelier de découverte d'analyses textuelles à partir d'extraits de la base Retro News, avec Calliope, IramuteQ, TXM et Gargantex