3 research outputs found
Recommended from our members
Using Word Embeddings to Uncover Discourses
Word embeddings are generally trained on very large corpora to ensure their reliability and to better perform in specific sets of tasks.Critical Discourse Analysis usually studies corpora of much more modest sizes, but could use the word similarity ratings that word embeddings can provide. In this paper, we explore the possiblity of using word embeddings on these smaller corpora and see how the results we obtain can be interpreted when synchronically analysing corpora from different groups
Approches formelles de la communication d'identités conflictuelles dans le discours
This dissertation focuses on a proposal for the formal modelling of a very specific phenomenon of political communication usually called ``dogwhistles''. A secondary contribution is an attempt to use (and a reflexive approach to the use of) machine learning techniques for the study of said dogwhistles. From a theoretical point of view, this work draws inspiration from game theoretic approaches of linguistics and pragmatics, game theoretic approaches of social meaning, and distributional semantics. Beyond the main contributions, the thesis presents briefly each of these areas of research, since it is likely that readers might not know much about at least one of these areas, and I therefore hope that these introductory texts can be also counted among the contributions of this work. Formal linguistics has devised a number of sophisticated mathematical objects to try and describe linguistic phenomena with as much precision as possible for the last decades. There is however one area of linguistics that has historically evaded attempts at formalization: sociolinguistics. The few attempts at formalizing sociolinguistics results are fairly recent. Inspired by tools from formal pragmatics, they have expanded the concept of linguistic interpretation to the interpretation not only of message content, but of social meaning as well, leading to elaborate formal models that are at the basis of fascinating research programmes. There has been however few attempts at linking the works from formal pragmatics and semantics -- focusing mostly on the interpretation of content -- and formal sociolinguistics -- focusing on the interpretation of social meaning. Notably, there have been no attempts at giving a picture in formal terms of situations whereby the social meaning contained within an utterance can influence the content interpretation of that utterance by listeners. In this work, we focus on situations where speakers send messages where the social meaning and content interpretations vary according to who receives them. This phenomenon is sometimes referred to as dogwhistle politics, since it has been mostly studied in the context of political discourse. Using formal tools from pragmatics (Rational Speech Act models) and their adaptations in the realm of sociolinguistics (Social Meaning Games), we aim to construct a model that can accurately describes these situations, where the retrieval of the identity of the speaker can supposedly lead to a variety of interpretations, linking the notions of social meaning and content meaning in a single kind of linguistic game. Beyond this endeavor, a key characteristic of dogwhistles is that they are supposedly hidden messages to a point. This leads to a situation where it can be difficult to assess whether a given utterance does or does not contain a dogwhistle. Acknowledging this, we have tried to give a definition of dogwhistles that goes beyond their mere description and could be applied to the enterprise of finding them in text, using concepts from distributional semantics, vector space models of language and machine learning.Cette thèse a pour objet la modélisation formelle d'un phénomène très spécifique de la communication politique généralement appelé "dogwhistle". Une seconde contribution de ce travail consiste en une tentative d'utilisation (ainsi qu'un réflexion sur cette utilisation) de techniques d'apprentissage automatique pour l'étude des dogwhistles en question. D'un point de vue théorique, ce travail s'inspire d'approches en théorie des jeux en linguistique, notamment celles portant sur la notion de sens social, et de sémantique distributionnelle. Au-delà des contributions principales, la thèse présente brièvement chacun de ces domaines de recherche, puisqu'il est probable que les lecteurices manquent de familiarité avec au moins l'une de ces notions. J'espère donc que ces textes introductifs puissent être comptés parmi les contributions de la thèse. La linguistique formelle a au cours des dernières décennies conçu un nombre important d'objets mathématiques sophistiqués pour tenter de décrire différents phénomènes linguistiques avec autant de précision que possible. Il existe cependant un champ de la linguistique ayant historiquement échappé aux tentatives de formalisation: la sociolinguistique. Les quelques tentatives de formalisation de résultats en sociolinguistique sont relativement récents. A l'aide d'outils issus de la pragmatique formelle, ces formalisation ont étendu la notion d'interprétation des messages linguistiques à leur interprétation non seulement en termes propositionnels, mais aussi en termes de sens social, menant à des modèles complexes qui sont à la base de programmes de recherche entiers. Il n'y a cependant eu que peu de tentatives de relier les travaux en en pragmatique et sémantique formelles à ceux de la sociolinguistique formelle. En particulier, il n'y a pas eu de travaux donnant à voir une description en termes formels de situations dans lesquelles le sens social contenu dans un énoncé soit en mesure d'influencer son sens propositionnel dans la réception par les interlocuteurices. Dans ce travail, nous nous concentrons sur des situations dans lesquelles des locuteurices envoient des messages dans lesquels le sens social et le sens propositionnel varient selon l'identité des interlocuteurices. Ce phénomène, qu'on pourrait appeler "politique du sifflet à chien" (dogwhistle politics) a été essentiellement étudié dans le cadre de la communication politique. En utilisant les outils formels de la pragmatique (en particulier les modèles basés sur le Rational Speech Act) et leurs adaptations dans le monde de la sociolinguistique (Social Meaning Games), nous tenterons de construire un modèle qui puisse adéquatement décrire ces situations dans lesquelles l'attribution d'une identité particulière à l'émetteurice d'un message conduit supposément à un ensemble d'interprétations différentes, liant par là les notions de sens social et de sens propositionnel en un unique jeu linguistique. Au-delà de cette tâche, une caractéristique clé des dogwhistle se trouve dans leur côté caché. Cela implique qu'il peut être difficile de savoir si un énoncé donné contient ou non un dogwhistle. Au vu de cette difficulté, nous avons également tenté de donner une définition des dogwhistles allant au-delà de leur simple description et pouvant être appliqué à l'entreprise de leur découverte dans un texte, grâce à l'utilisation de concepts issus de la sémantique dsitributionelle, des modèles vectoriels de langage et d'apprentissage automatique