Search CORE

104 research outputs found

Identification automatique des relations discursives implicites à partir de corpus annotés et de données brutes

Author: Braud Chloé
Publication venue: HAL CCSD
Publication date: 18/12/2015
Field of study

Building discourse parsers is currently a major challenge in Natural Language Processing. The identification of the relations (such as Explanation, Contrast ...) linking spans of text in the document is the main difficulty. Especially, identifying the so-called implicit relations, that is the relations that lack a discourse connective (such as but, because . . .), is known as an hard task since it requires to take into account various factors, and because it leads to specific difficulties in a classification system. In this thesis, we use raw data to improve automatic identification of implicit relations.First, we propose to use discourse markers in order to automatically annotate new data. We use domain adaptation methods to deal with the distributional differences between automatically and manually annotated data : we report improvements for systems built on the French corpus ANNODIS and on the English corpus Penn Discourse Treebank. Then, we propose to use word representations built from raw data, which may be automatically annotated with discourse markers, in order to feed a representation of the data based on the words found in the spans of text to be linked. We report improvements on the English corpus Penn Discourse Treebank, and especially we show that this method alleviates the need for rich resources, available but for a few languages.Le développement de systèmes d’analyse discursive automatique des documents est un enjeu actuel majeur en Traitement Automatique des Langues. La difficulté principale correspond à l’étape d’identification des relations (comme Explication, Contraste . . .) liant les segments constituant le document. En particulier, l’identification des relations dites implicites, c’est-à-dire non marquées par un connecteur discursif (comme mais, parce que . . .), est réputée difficile car elle nécessite la prise en compte d’indices variés et correspond à des difficultés particulières dans le cadre d’un système de classification automatique. Dans cette thèse, nous utilisons des données brutes pour améliorer des systèmes d’identification automatique des relations implicites.Nous proposons d’abord d’utiliser les connecteurs pour annoter automatiquement de nouvelles don- nées. Nous mettons en place des stratégies issues de l’adaptation de domaine qui nous permettent de gérer les différences en termes distributionnels entre données annotées automatiquement et manuellement : nous rapportons des améliorations pour des systèmes construits sur le corpus français ANNODIS et sur le corpus anglais du Penn Discourse Treebank. Ensuite, nous proposons d’utiliser des représentations de mots acquises à partir de données brutes, éventuellement annotées automatiquement en connecteurs, pour enrichir la représentation des données fondées sur les mots présents dans les segments à lier. Nous rapportons des améliorations sur le corpus anglais du Penn Discourse Treebank et montrons notamment que cette méthode permet de limiter le recours à des ressources riches, disponibles seulement pour peu de langues

Thèses en Ligne

INRIA a CCSD electronic archive server

Hal-Diderot

Extraction non supervisée de relations sémantiques lexicales

Author: Afantenos Stergos
Asher Nicholas
Conrath Juliette
Muller Philippe
Publication venue: HAL CCSD
Publication date: 01/07/2014
Field of study

International audienceNous présentons une base de connaissances comportant des triplets de paires de verbes associés avec une relation sémantique/discursive, extraits du corpus français frWaC par une méthode s’appuyant sur la présence d’unconnecteur discursif reliant deux verbes. Nous détaillons plusieurs mesures visant à évaluer la pertinence des triplets et la force d’association entre la relation sémantique/discursive et la paire de verbes. L’évaluation intrinsèque est réalisée par rapport à des annotations manuelles. Une évaluation de la couverture de la ressource est également réalisée par rapport au corpus Annodis annoté discursivement. Cette étude produit des résultats prometteurs démontrant l’utilité potentielle de notre ressource pour les tâches d’analyse discursive mais aussi des tâches de nature sémantique

Scientific Publications of the University of Toulouse II Le Mirail

Open Archive Toulouse Archive Ouverte

Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition. Volume 2 : Traitement Automatique des Langues Naturelles

Author: Benzitoun Christophe
Braud Chloé
Huber Laurine
Langlois David
Ouni Slim
Pogodalla Sylvain
Schneider Stéphane
Publication venue: AFCP
Publication date: 01/01/2020
Field of study

@ 6ème conférence conjointe: JEP-TALN-RECITAL 2020no abstrac

INRIA a CCSD electronic archive server

La progression de l'explication dans l'investigation collective d'une problématique sociale à l'écrit par des élèves du secondaire

Author: Croteau-Bouffard Marie-Hélène
Publication venue
Publication date: 13/04/2018
Field of study

CorpusUL

La participation régionale à l’interface politiques-opérations : paradoxes dans l’administration fédérale canadienne

Author: Kubina Camille
Publication venue
Publication date: 01/01/2016
Field of study

Cette thèse explore le paradoxe de participation régionale produit de la contradiction entre le discours institutionnel d’inclusion et le sentiment régional d’exclusion de la prise de décision lors de la mise en œuvre des politiques publiques dans l’administration fédérale canadienne. La question au cœur de notre démarche est celle de la construction de la participation dans le discours des réunions à l’interface politiques-opérations composée des cadres de direction centraux et régionaux qui forment le niveau intermédiaire entre les cadres dirigeants et les gestionnaires opérationnels. Cette thèse innove en étudiant, selon un cadre théorique paradoxal, des échanges horizontaux d’information entre pairs dans des organisations dispersées géographiquement. Une comparaison de deux cas de l’administration fédérale canadienne combinant l’observation non participante, des entrevues semi-dirigées et une analyse documentaire, nous a permis non seulement de distinguer les diverses interprétations de la participation régionale à la prise de décision, mais aussi de comprendre la gestion des tensions paradoxales par les divers acteurs. Le paradoxe de participation engendre des tensions qui sont gérées selon des stratégies différentes. Dans un cas, le sens de la participation régionale est réel et la contradiction entre la plurivocalité et le respect de l’échéance est gérée dans une pratique de juxtaposition des deux pôles contradictoires. Dans l’autre cas, la participation régionale est symbolique et la tension, entre le respect de l’échéance au détriment de l’inclusion des informations régionales, suit une stratégie d’évitement des tensions. Dans ce cas, la non-participation régionale, ou silence, est imposée sous une façade de consultation des régions après qu’une décision soit prise au centre. Nous illustrons les distinctions des deux cas en proposant le modèle du sablier pour représenter une organisation comme l’administration fédérale canadienne qui a un double mandat, c’est-à-dire de conseiller le gouvernement et de fournir des services. Cette thèse contribue au domaine de l’administration publique par l’attention portée au management public en région et contribue par une recherche empirique du concept de la participation appliqué à un groupe rarement étudié parce qu’il est difficile d’accès : les cadres de direction. La conceptualisation de la participation comme la possibilité d’exprimer sa voix pour exercer une influence sur le travail a permis également d’enrichir la recherche sur le silence organisationnel en distinguant le silence intentionnel du silence imposé. Cette thèse propose que des recherches ultérieures se penchent sur les stratégies de gestion des paradoxes dans les organisations publiques

ESPACE ENAP

Identifier les relations discursives implicites en combinant données naturelles et données artificielles

Author: Braud Chloé
Denis Pascal
Publication venue: Lavoisier (Hermes Science Publications)
Publication date: 12/12/2014
Field of study

International audienceThis paper presents the first experiments on French in automatic identification of implicit discourse relations (i.e. relations that lack an overt connective). Our systems exploit hand-labeled implicit examples, along with artificial implicit examples obtained from explicit examples by suppressing their connective, following Marcu et Echihabi (2002). Previous work on English shows that using artificial data for training largely degrades performance on natural data, reflecting important differences in the distribution. This conclusion, that also holds for French, has led us to consider various methods inspired by domain adaptation to better combine the data. We evaluate these methods on the ANNODIS corpus: our best system achieves a 41.7 % accuracy, that is a significant gain of 4.4 % compared to a model using only the natural data. MOTS-CLÉS : structure discursive, relations discursives implicites, apprentissage automatique.Cet article présente les premières expériences sur le français d'identification automatique des relations discursives implicites (i.e., non marquées par un connecteur). Nos systèmes exploitent des exemples implicites annotés, ainsi que des exemples implicites artificiels obtenus à partir d'exemples explicites par suppression du connecteur, une méthode introduite par Marcu et Echihabi (2002). Les précédentes études sur l'anglais montrent que l'utilisation à l'entraînement des données artificielles dégrade largement les performances sur les données naturelles, ce qui reflète des différences importantes en termes de distribution. Ce constat, qui tient aussi pour le français, nous a amenés à envisager différentes méthodes, inspirées de l'adaptation de domaine, visant à combiner plus efficacement les données. Nous évaluons ces méthodes sur le corpus ANNODIS : notre meilleur système obtient 41,7 % d'exactitude, soit un gain significatif de 4,4 % par rapport à un modèle n'utilisant que les données naturelles

HAL - Lille 3

INRIA a CCSD electronic archive server

Hal-Diderot

Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018

Author: Ranwez Sylvie
Publication venue: HAL CCSD
Publication date: 04/07/2018
Field of study

International audienc

Attitudes discriminatoires et comportements racistes : préalables théoriques et épistémologiques au développement d'approches et d'instruments d'enquêtes sociologiques

Author: Corbeil Jean-Pierre
Publication venue
Publication date: 01/01/2006
Field of study

Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal

Dépôt Institutionnel Numérique

GeoGebraTUTOR : développement d’un système tutoriel autonome pour l’accompagnement d’élèves en situation de résolution de problèmes de démonstration en géométrie plane et genèse d’un espace de travail géométrique idoine

Author: Tessier-Baillargeon Michèle
Publication venue
Publication date: 01/07/2015
Field of study

Travaux d'études doctorales réalisées conjointement avec les travaux de recherches doctorales de Nicolas Leduc, étudiant au doctorat en génie informatique à l'École Polytechnique de Montréal.Cette thèse vise le développement de GeoGebraTUTOR (GGBT), un espace de travail géométrique (ETG) qui intègre un système tutoriel pour l’obtention d’un milieu respectueux du raisonnement idiosyncratique de l’élève. Le raisonnement mathématique, comme l’apprentissage, ne s’exerce pas de manière linéaire, il repose sur un remaniement conceptuel continu. Il est donc peu étonnant qu’une approche séquentielle inflexible pour l’exercice de la démonstration en géométrie soit source d’embûches. Les systèmes tutoriels existants pour l’exercice de la démonstration en géométrie offrent une variété d’outils sans pour autant soulager l’élève de cette rigidité. Le design multidisciplinaire de GGBT repose sur une conception dans l’usage qui articule plusieurs cycles de recherche et de développement successifs. Cette méthodologie itérative et anthropocentrique confère à GGBT une intelligence qui nait d’une convergence d’analyses a priori et a posteriori successives. Cette thèse concerne les deux premiers cycles du développement de GGBT. La première phase du développement implique l’élaboration a priori d’un système capable de recevoir et d’analyser les démarches singulières de démonstration des élèves en fonction de solutions expertes préalablement identifiées. Ce premier prototype de GGBT est conçu en fonction d’une analyse de la relation didactique entre un enseignant réel et l’élève, et la relation didactique simulée entre un agent tuteur virtuel et ce même élève. Cette analyse théorique a priori établit un cadre conceptuel liminaire qui vise à encadrer la création d’un ETG idoine permettant à l’apprenti géomètre de se livrer à son travail mathématique. Cette version initiale de GGBT est mise à l’essai par des élèves réels guidés par leur enseignant ordinaire. Leurs interactions sont ensuite étudiées pour modéliser et implémenter un premier système tutoriel autonome à l’image des échanges témoignant du contrat didactique observé. Le second cycle de développement s’amorce avec la modélisation et la programmation d’une structure tutorielle autonome et d’une interface renouvelée, qui contribuent conjointement au design a priori d’un espace de travail géométrique. La deuxième version ainsi obtenue est également testée en contexte de classe réel. Cette fois, l’exercice empirique vise la validation de la gestion des messages par le système tutoriel et l’exploration des raisonnements instrumentés dans une perspective de précision du travail géométrique possible à l’interface de l’ETG qu’est GGBT. Ce parcours doctoral se clôt par l’exploration d’avenues de recherche potentielles pour la poursuite du développement et du raffinement de GGBT.This thesis aims at modeling GeoGebraTUTOR, a geometrical workspace that relies on the works of a tutorial system for the definition of a milieu respectful of the student’s idiosyncratic reasoning. Mathematical reasoning, like learning, does not evolve in a linear fashion. It relies on continuous conceptual reorganizations. Therefore, it is little wonder that a linear and inflexible approach for the exercise of geometrical proof creates difficulties. Existing tutorial systems for the solving of geometrical proof problems offer a variety of tools without relieving the student of this rigidity. GGBT’s multidisciplinary design relies on a design in use approach that articulates a series of research and development cycles. This iterative anthropocentric methodology provides GGBT with an intelligence resulting from the confrontation of successive a priori and a posteriori analyses. This thesis is rooted in GGBT’s two first development cycles. The first phase of design implies the planning of a system able to take in singular student proofs and analyze their value compared to previously implemented expert answers. This first GGBT prototype is designed according to an analysis of the didactical relationship between the teacher and the student as well as the relationship that takes place between the student and the tutor agent who evolves within the didactical milieu. This a priori analysis establishes theoretical guidelines, which will steer the design of a geometrical workspace that enables the learning geometer to accomplish his mathematical work. A first GGBT prototype is put to the test with real students assisted by their regular teacher. Their interactions are then studied in order to model and implement a first self-governing tutorial system according to the dialogues reflecting the observed didactical contract. The second design cycle begins with the modeling and programming of a tutorial structure and of a renewed interface, both of which contribute to the planning of a geometrical workspace. This second prototype is also tested in a real class environment, although this time the empirical exercise aims, on the one hand, at validating the management of the tutor’s help messages, and on the other hand at exploring the student’s instrumented reasoning to specify the mathematical activity made possible by the GGBT geometrical workspace. This doctoral endeavor ends with the exploration of potential research avenues for the ongoing design and refining of GGBT

Dépôt Institutionnel Numérique

Langage, engagement et émotions (les ressources de la génération linguistique et de l'intégration émotionnelle dans le discours scientifique)

Author: BANKS David
PICHARD Hugues
Publication venue
Publication date: 01/01/2012
Field of study

L'émotion et le discours scientifique sont traditionnellement deux domaines considérés comme incompatibles du fait du caractère subjectif de la première et des exigences d'objectivité et de neutralité du dernier. La thèse propose une étude des processus en œuvre dans la génération des émotions en relation avec la constitution du discours, et ensuite des stratégies ou modes d'intégration des phénomènes de manifestations émotionnelles dans le discours final. L'étude combine une approche psychologique et linguistique des émotions et s'articule autour de la transition entre le domaine mental et celui de la préparation et de l'expression finale des émotions générées dans le discours (lien entre l'évaluation cognitive et l'Appraisal theory en linguistique). Une synthèse de grandes typologies des modes d'inclusion, ainsi que des grands types de manifestations de charges émotionnelles-affectives globale est présentée dans la thèse. Cette même synthèse est issue de la recherche et de l'analyse de manifestations d'émotions incluses volontairement ou non dans un corpus d'articles de la presse scientifique anglophone soumise à comité de relecture. L'un des objectifs étant de déterminer si le discours scientifique présente des manifestations de subjectivité des auteurs, et par quels biais ces phénomènes de subjectivité et d'émotion s'encodent dans des textes devant, selon les normes et conventions, être aussi objectifs et neutres que possible, quelle que soit la discipline concernée. A donc été soulevée la question de la part prise par l'émotion dans le discours en général, de sa constitution à son expression.Emotion and scientific discourse are, by tradition, considered to be incompatible due to the subjective nature of the former and the objectivity requirements of the latter. The thesis deals with a study of the processes involved in emotion generation in relation with discourse generation. This is followed by the approach of the modes or strategies of inclusion of emotion manifestation phenomena in the final discourse. The study combines a psychological and linguistic approach of emotions, and revolves around the transition stage between the mental domain and that of language elaboration, leading to communicating the previously generated emotions in discourse (link between cognitive appraisal and the Appraisal theory in linguistics). The thesis sums up the broad categories of inclusion modes, as well as the main global emotion/affect load manifestation types. This very synthesis is the result of the research and analysis of emotion manifestations deliberately or accidentally included into a selection of articles sampled out from english-speaking peer-reviewed scientific press. One of the goals was to determine if scientific discourse contains and displays the authors' subjectivity and emotion manifestations, and how these phenomena are encoded in texts that are primarily meant (according to norms and conventions) to be as objective and neutral as possible, regardless of the subject. Thus was raised the question of the importance of the share taken by emotion in any discourse, from its generation to the moment it is uttered.BREST-SCD-Bib. electronique (290199901) / SudocSudocFranceF

OpenGrey Repository