104 research outputs found
Identification automatique des relations discursives implicites à partir de corpus annotés et de données brutes
Building discourse parsers is currently a major challenge in Natural Language Processing. The identification of the relations (such as Explanation, Contrast ...) linking spans of text in the document is the main difficulty. Especially, identifying the so-called implicit relations, that is the relations that lack a discourse connective (such as but, because . . .), is known as an hard task since it requires to take into account various factors, and because it leads to specific difficulties in a classification system. In this thesis, we use raw data to improve automatic identification of implicit relations.First, we propose to use discourse markers in order to automatically annotate new data. We use domain adaptation methods to deal with the distributional differences between automatically and manually annotated data : we report improvements for systems built on the French corpus ANNODIS and on the English corpus Penn Discourse Treebank. Then, we propose to use word representations built from raw data, which may be automatically annotated with discourse markers, in order to feed a representation of the data based on the words found in the spans of text to be linked. We report improvements on the English corpus Penn Discourse Treebank, and especially we show that this method alleviates the need for rich resources, available but for a few languages.Le deÌveloppement de systeÌmes dâanalyse discursive automatique des documents est un enjeu actuel majeur en Traitement Automatique des Langues. La difficulteÌ principale correspond aÌ lâeÌtape dâidentification des relations (comme Explication, Contraste . . .) liant les segments constituant le document. En particulier, lâidentification des relations dites implicites, câest-aÌ-dire non marqueÌes par un connecteur discursif (comme mais, parce que . . .), est reÌputeÌe difficile car elle neÌcessite la prise en compte dâindices varieÌs et correspond aÌ des difficulteÌs particulieÌres dans le cadre dâun systeÌme de classification automatique. Dans cette theÌse, nous utilisons des donneÌes brutes pour ameÌliorer des systeÌmes dâidentification automatique des relations implicites.Nous proposons dâabord dâutiliser les connecteurs pour annoter automatiquement de nouvelles don- neÌes. Nous mettons en place des strateÌgies issues de lâadaptation de domaine qui nous permettent de geÌrer les diffeÌrences en termes distributionnels entre donneÌes annoteÌes automatiquement et manuellement : nous rapportons des ameÌliorations pour des systeÌmes construits sur le corpus français ANNODIS et sur le corpus anglais du Penn Discourse Treebank. Ensuite, nous proposons dâutiliser des repreÌsentations de mots acquises aÌ partir de donneÌes brutes, eÌventuellement annoteÌes automatiquement en connecteurs, pour enrichir la repreÌsentation des donneÌes fondeÌes sur les mots preÌsents dans les segments aÌ lier. Nous rapportons des ameÌliorations sur le corpus anglais du Penn Discourse Treebank et montrons notamment que cette meÌthode permet de limiter le recours aÌ des ressources riches, disponibles seulement pour peu de langues
Extraction non supervisée de relations sémantiques lexicales
International audienceNous prĂ©sentons une base de connaissances comportant des triplets de paires de verbes associĂ©s avec une relation sĂ©mantique/discursive, extraits du corpus français frWaC par une mĂ©thode sâappuyant sur la prĂ©sence dâunconnecteur discursif reliant deux verbes. Nous dĂ©taillons plusieurs mesures visant Ă Ă©valuer la pertinence des triplets et la force dâassociation entre la relation sĂ©mantique/discursive et la paire de verbes. LâĂ©valuation intrinsĂšque est rĂ©alisĂ©e par rapport Ă des annotations manuelles. Une Ă©valuation de la couverture de la ressource est Ă©galement rĂ©alisĂ©e par rapport au corpus Annodis annotĂ© discursivement. Cette Ă©tude produit des rĂ©sultats prometteurs dĂ©montrant lâutilitĂ© potentielle de notre ressource pour les tĂąches dâanalyse discursive mais aussi des tĂąches de nature sĂ©mantique
Actes de la 6e confĂ©rence conjointe JournĂ©es d'Ătudes sur la Parole (JEP, 33e Ă©dition), Traitement Automatique des Langues Naturelles (TALN, 27e Ă©dition), Rencontre des Ătudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RĂCITAL, 22e Ă©dition. Volume 2 : Traitement Automatique des Langues Naturelles
@ 6Úme conférence conjointe: JEP-TALN-RECITAL 2020no abstrac
La participation rĂ©gionale Ă lâinterface politiques-opĂ©rations : paradoxes dans lâadministration fĂ©dĂ©rale canadienne
Cette thĂšse explore le paradoxe de participation rĂ©gionale produit de la contradiction entre le discours institutionnel dâinclusion et le sentiment rĂ©gional dâexclusion de la prise de dĂ©cision lors de la mise en Ćuvre des politiques publiques dans lâadministration fĂ©dĂ©rale canadienne. La question au cĆur de notre dĂ©marche est celle de la construction de la participation dans le discours des rĂ©unions Ă lâinterface politiques-opĂ©rations composĂ©e des cadres de direction centraux et rĂ©gionaux qui forment le niveau intermĂ©diaire entre les cadres dirigeants et les gestionnaires opĂ©rationnels.
Cette thĂšse innove en Ă©tudiant, selon un cadre thĂ©orique paradoxal, des Ă©changes horizontaux dâinformation entre pairs dans des organisations dispersĂ©es gĂ©ographiquement. Une comparaison de deux cas de lâadministration fĂ©dĂ©rale canadienne combinant lâobservation non participante, des entrevues semi-dirigĂ©es et une analyse documentaire, nous a permis non seulement de distinguer les diverses interprĂ©tations de la participation rĂ©gionale Ă la prise de dĂ©cision, mais aussi de comprendre la gestion des tensions paradoxales par les divers acteurs.
Le paradoxe de participation engendre des tensions qui sont gĂ©rĂ©es selon des stratĂ©gies diffĂ©rentes. Dans un cas, le sens de la participation rĂ©gionale est rĂ©el et la contradiction entre la plurivocalitĂ© et le respect de lâĂ©chĂ©ance est gĂ©rĂ©e dans une pratique de juxtaposition des deux pĂŽles contradictoires. Dans lâautre cas, la participation rĂ©gionale est symbolique et la tension, entre le respect de lâĂ©chĂ©ance au dĂ©triment de lâinclusion des informations rĂ©gionales, suit une stratĂ©gie dâĂ©vitement des tensions. Dans ce cas, la non-participation rĂ©gionale, ou silence, est imposĂ©e sous une façade de consultation des rĂ©gions aprĂšs quâune dĂ©cision soit prise au centre.
Nous illustrons les distinctions des deux cas en proposant le modĂšle du sablier pour reprĂ©senter une organisation comme lâadministration fĂ©dĂ©rale canadienne qui a un double mandat, câest-Ă -dire de conseiller le gouvernement et de fournir des services. Cette thĂšse contribue au domaine de lâadministration publique par lâattention portĂ©e au management public en rĂ©gion et contribue par une recherche empirique du concept de la participation appliquĂ© Ă un groupe rarement Ă©tudiĂ© parce quâil est difficile dâaccĂšs : les cadres de direction. La conceptualisation de la participation comme la possibilitĂ© dâexprimer sa voix pour exercer une influence sur le travail a permis Ă©galement dâenrichir la recherche sur le silence organisationnel en distinguant le silence intentionnel du silence imposĂ©. Cette thĂšse propose que des recherches ultĂ©rieures se penchent sur les stratĂ©gies de gestion des paradoxes dans les organisations publiques
Identifier les relations discursives implicites en combinant données naturelles et données artificielles
International audienceThis paper presents the first experiments on French in automatic identification of implicit discourse relations (i.e. relations that lack an overt connective). Our systems exploit hand-labeled implicit examples, along with artificial implicit examples obtained from explicit examples by suppressing their connective, following Marcu et Echihabi (2002). Previous work on English shows that using artificial data for training largely degrades performance on natural data, reflecting important differences in the distribution. This conclusion, that also holds for French, has led us to consider various methods inspired by domain adaptation to better combine the data. We evaluate these methods on the ANNODIS corpus: our best system achieves a 41.7 % accuracy, that is a significant gain of 4.4 % compared to a model using only the natural data. MOTS-CLĂS : structure discursive, relations discursives implicites, apprentissage automatique.Cet article prĂ©sente les premiĂšres expĂ©riences sur le français d'identification automatique des relations discursives implicites (i.e., non marquĂ©es par un connecteur). Nos systĂšmes exploitent des exemples implicites annotĂ©s, ainsi que des exemples implicites artificiels obtenus Ă partir d'exemples explicites par suppression du connecteur, une mĂ©thode introduite par Marcu et Echihabi (2002). Les prĂ©cĂ©dentes Ă©tudes sur l'anglais montrent que l'utilisation Ă l'entraĂźnement des donnĂ©es artificielles dĂ©grade largement les performances sur les donnĂ©es naturelles, ce qui reflĂšte des diffĂ©rences importantes en termes de distribution. Ce constat, qui tient aussi pour le français, nous a amenĂ©s Ă envisager diffĂ©rentes mĂ©thodes, inspirĂ©es de l'adaptation de domaine, visant Ă combiner plus efficacement les donnĂ©es. Nous Ă©valuons ces mĂ©thodes sur le corpus ANNODIS : notre meilleur systĂšme obtient 41,7 % d'exactitude, soit un gain significatif de 4,4 % par rapport Ă un modĂšle n'utilisant que les donnĂ©es naturelles
Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018
International audienc
Attitudes discriminatoires et comportements racistes : prĂ©alables thĂ©oriques et Ă©pistĂ©mologiques au dĂ©veloppement d'approches et d'instruments d'enquĂȘtes sociologiques
ThÚse numérisée par la Direction des bibliothÚques de l'Université de Montréal
GeoGebraTUTOR : dĂ©veloppement dâun systĂšme tutoriel autonome pour lâaccompagnement dâĂ©lĂšves en situation de rĂ©solution de problĂšmes de dĂ©monstration en gĂ©omĂ©trie plane et genĂšse dâun espace de travail gĂ©omĂ©trique idoine
Travaux d'Ă©tudes doctorales rĂ©alisĂ©es conjointement avec les travaux de recherches doctorales de Nicolas Leduc, Ă©tudiant au doctorat en gĂ©nie informatique Ă l'Ăcole Polytechnique de MontrĂ©al.Cette thĂšse vise le dĂ©veloppement de GeoGebraTUTOR (GGBT), un espace de travail gĂ©omĂ©trique (ETG) qui intĂšgre un systĂšme tutoriel pour lâobtention dâun milieu respectueux du raisonnement idiosyncratique de lâĂ©lĂšve.
Le raisonnement mathĂ©matique, comme lâapprentissage, ne sâexerce pas de maniĂšre linĂ©aire, il repose sur un remaniement conceptuel continu. Il est donc peu Ă©tonnant quâune approche sĂ©quentielle inflexible pour lâexercice de la dĂ©monstration en gĂ©omĂ©trie soit source dâembĂ»ches. Les systĂšmes tutoriels existants pour lâexercice de la dĂ©monstration en gĂ©omĂ©trie offrent une variĂ©tĂ© dâoutils sans pour autant soulager lâĂ©lĂšve de cette rigiditĂ©.
Le design multidisciplinaire de GGBT repose sur une conception dans lâusage qui articule plusieurs cycles de recherche et de dĂ©veloppement successifs. Cette mĂ©thodologie itĂ©rative et anthropocentrique confĂšre Ă GGBT une intelligence qui nait dâune convergence dâanalyses a priori et a posteriori successives. Cette thĂšse concerne les deux premiers cycles du dĂ©veloppement de GGBT.
La premiĂšre phase du dĂ©veloppement implique lâĂ©laboration a priori dâun systĂšme capable de recevoir et dâanalyser les dĂ©marches singuliĂšres de dĂ©monstration des Ă©lĂšves en fonction de solutions expertes prĂ©alablement identifiĂ©es. Ce premier prototype de GGBT est conçu en fonction dâune analyse de la relation didactique entre un enseignant rĂ©el et lâĂ©lĂšve, et la relation didactique simulĂ©e entre un agent tuteur virtuel et ce mĂȘme Ă©lĂšve. Cette analyse thĂ©orique a priori Ă©tablit un cadre conceptuel liminaire qui vise Ă encadrer la crĂ©ation dâun ETG idoine permettant Ă lâapprenti gĂ©omĂštre de se livrer Ă son travail mathĂ©matique. Cette version initiale de GGBT est mise Ă lâessai par des Ă©lĂšves rĂ©els guidĂ©s par leur enseignant ordinaire. Leurs interactions sont ensuite Ă©tudiĂ©es pour modĂ©liser et implĂ©menter un premier systĂšme tutoriel autonome Ă lâimage des Ă©changes tĂ©moignant du contrat didactique observĂ©.
Le second cycle de dĂ©veloppement sâamorce avec la modĂ©lisation et la programmation dâune structure tutorielle autonome et dâune interface renouvelĂ©e, qui contribuent conjointement au design a priori dâun espace de travail gĂ©omĂ©trique. La deuxiĂšme version ainsi obtenue est Ă©galement testĂ©e en contexte de classe rĂ©el. Cette fois, lâexercice empirique vise la validation de la gestion des messages par le systĂšme tutoriel et lâexploration des raisonnements instrumentĂ©s dans une perspective de prĂ©cision du travail gĂ©omĂ©trique possible Ă lâinterface de lâETG quâest GGBT.
Ce parcours doctoral se clĂŽt par lâexploration dâavenues de recherche potentielles pour la poursuite du dĂ©veloppement et du raffinement de GGBT.This thesis aims at modeling GeoGebraTUTOR, a geometrical workspace that relies on the works of a tutorial system for the definition of a milieu respectful of the studentâs idiosyncratic reasoning.
Mathematical reasoning, like learning, does not evolve in a linear fashion. It relies on continuous conceptual reorganizations. Therefore, it is little wonder that a linear and inflexible approach for the exercise of geometrical proof creates difficulties. Existing tutorial systems for the solving of geometrical proof problems offer a variety of tools without relieving the student of this rigidity.
GGBTâs multidisciplinary design relies on a design in use approach that articulates a series of research and development cycles. This iterative anthropocentric methodology provides GGBT with an intelligence resulting from the confrontation of successive a priori and a posteriori analyses. This thesis is rooted in GGBTâs two first development cycles.
The first phase of design implies the planning of a system able to take in singular student proofs and analyze their value compared to previously implemented expert answers. This first GGBT prototype is designed according to an analysis of the didactical relationship between the teacher and the student as well as the relationship that takes place between the student and the tutor agent who evolves within the didactical milieu. This a priori analysis establishes theoretical guidelines, which will steer the design of a geometrical workspace that enables the learning geometer to accomplish his mathematical work. A first GGBT prototype is put to the test with real students assisted by their regular teacher. Their interactions are then studied in order to model and implement a first self-governing tutorial system according to the dialogues reflecting the observed didactical contract.
The second design cycle begins with the modeling and programming of a tutorial structure and of a renewed interface, both of which contribute to the planning of a geometrical workspace. This second prototype is also tested in a real class environment, although this time the empirical exercise aims, on the one hand, at validating the management of the tutorâs help messages, and on the other hand at exploring the studentâs instrumented reasoning to specify the mathematical activity made possible by the GGBT geometrical workspace.
This doctoral endeavor ends with the exploration of potential research avenues for the ongoing design and refining of GGBT
Langage, engagement et émotions (les ressources de la génération linguistique et de l'intégration émotionnelle dans le discours scientifique)
L'Ă©motion et le discours scientifique sont traditionnellement deux domaines considĂ©rĂ©s comme incompatibles du fait du caractĂšre subjectif de la premiĂšre et des exigences d'objectivitĂ© et de neutralitĂ© du dernier. La thĂšse propose une Ă©tude des processus en Ćuvre dans la gĂ©nĂ©ration des Ă©motions en relation avec la constitution du discours, et ensuite des stratĂ©gies ou modes d'intĂ©gration des phĂ©nomĂšnes de manifestations Ă©motionnelles dans le discours final. L'Ă©tude combine une approche psychologique et linguistique des Ă©motions et s'articule autour de la transition entre le domaine mental et celui de la prĂ©paration et de l'expression finale des Ă©motions gĂ©nĂ©rĂ©es dans le discours (lien entre l'Ă©valuation cognitive et l'Appraisal theory en linguistique). Une synthĂšse de grandes typologies des modes d'inclusion, ainsi que des grands types de manifestations de charges Ă©motionnelles-affectives globale est prĂ©sentĂ©e dans la thĂšse. Cette mĂȘme synthĂšse est issue de la recherche et de l'analyse de manifestations d'Ă©motions incluses volontairement ou non dans un corpus d'articles de la presse scientifique anglophone soumise Ă comitĂ© de relecture. L'un des objectifs Ă©tant de dĂ©terminer si le discours scientifique prĂ©sente des manifestations de subjectivitĂ© des auteurs, et par quels biais ces phĂ©nomĂšnes de subjectivitĂ© et d'Ă©motion s'encodent dans des textes devant, selon les normes et conventions, ĂȘtre aussi objectifs et neutres que possible, quelle que soit la discipline concernĂ©e. A donc Ă©tĂ© soulevĂ©e la question de la part prise par l'Ă©motion dans le discours en gĂ©nĂ©ral, de sa constitution Ă son expression.Emotion and scientific discourse are, by tradition, considered to be incompatible due to the subjective nature of the former and the objectivity requirements of the latter. The thesis deals with a study of the processes involved in emotion generation in relation with discourse generation. This is followed by the approach of the modes or strategies of inclusion of emotion manifestation phenomena in the final discourse. The study combines a psychological and linguistic approach of emotions, and revolves around the transition stage between the mental domain and that of language elaboration, leading to communicating the previously generated emotions in discourse (link between cognitive appraisal and the Appraisal theory in linguistics). The thesis sums up the broad categories of inclusion modes, as well as the main global emotion/affect load manifestation types. This very synthesis is the result of the research and analysis of emotion manifestations deliberately or accidentally included into a selection of articles sampled out from english-speaking peer-reviewed scientific press. One of the goals was to determine if scientific discourse contains and displays the authors' subjectivity and emotion manifestations, and how these phenomena are encoded in texts that are primarily meant (according to norms and conventions) to be as objective and neutral as possible, regardless of the subject. Thus was raised the question of the importance of the share taken by emotion in any discourse, from its generation to the moment it is uttered.BREST-SCD-Bib. electronique (290199901) / SudocSudocFranceF
- âŠ