    Mastering Overdetection and Underdetection in Learner-Answer Processing: Simple Techniques for Analysis and Diagnosis.

    International audienceThis paper presents a "didactic triangulation" strategy to cope with the problem of reliability of NLP applications for Computer Assisted Language Learning (CALL) systems. It is based on the implementation of basic but well mastered NLP techniques, and put the emphasis on an adapted gearing between computable linguistic clues and didactic features of the evaluated activities. We claim that a correct balance between noise (i.e. false error detection) - and silence (i.e. undetected errors) is not only an outcome of NLP techniques, but of an appropriate didactic integration of what NLP can do well - and what it cannot do. Based on this approach, ExoGen is a prototype for generating activities such as gapfill exercises. It integrates a module for error detection and description, which checks learners' answers against expected ones. Through the analysis of graphic, orthographic and morphosyntactic differences, it is able to diagnose problems like spelling errors, lexical mix-ups, errors prone agreement, conjugation errors, etc. The first evaluation of ExoGen outputs, based on the FRIDA learner corpus, has yielded very promising results, paving the way for the development of an efficient and general model adapted to a wide variety of activities

    Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique

    Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le développement d’un outil d’aide à son exploitation à partir de l’annotation de phénomènes linguistiques saillants. Nous nous concentrerons ici sur les écrits produits en fin de classe de CP par des scripteurs encore débutants. L’objet de ce travail est d’explorer les possibilités qu’offre le traitement automatique des langues pour appréhender ces écrits particulièrement éloignés de la norme. L’hypothèse est que la connaissance du contexte de production facilite ce processus. Nous mesurons cet apport au travers d’un exemple de traitement, à savoir le développement d’un outil d’aide à l’annotation de certaines erreurs orthographiques. Après une rapide présentation du projet et des caractéristiques du corpus élaboré, l’article propose un exposé détaillé du module d’annotation de ces erreurs. Il en expose la méthode d’identification et de correction au moyen d’une ressource lexicale de formes phonologiques ainsi que le modèle d’annotation élaboré.Constituting a school corpora with NLP Our study takes part in a project which aims at elaborating a large corpus of school texts and at developing a linguistic tool facilitating its exploitation. In this article, the focus is put on texts written by novice writers: children at the end of the first year of schooling (6-7 year-old). This study explores possibilities given by natural language processing to annotate non-normed school corpora. Our hypothesis is that the knowledge of the context can ease this process. We measure this contribution through an example of processing, the development of a help tool for specific spell checking. First the project and specificities of the corpus are presented; then, the spell errors annotation module is detailed, both the spell checking methods on the basis of a phonological lexical resource and the annotation model

    Functional classes of bronchial mucosa genes that are differentially expressed in asthma

    BACKGROUND: Asthma pathogenesis and susceptibility involves a complex interplay between genetic and environmental factors. Their interaction modulates the airway inflammation and remodelling processes that are present even in mild asthma and governs the appearance and severity of symptoms of airway hyperresponsiveness. While asthma is felt to develop as the result of interaction among many different genes and signalling pathways, only a few genes have been linked to an increased risk of developing this condition. RESULTS: We report the results of expression microarray studies using tissue obtained from bronchial biopsies of healthy controls and of subjects with allergic asthma, both before and following inhaled corticotherapy. We identified 79 genes that show significant differences in expression (following Bonferroni cutoff using p < 6.6 Ă— 10(-6 )to correct for multiple testing) in asthmatics compared to controls at significance levels. These included 21 genes previously implicated in asthma, such as NOS2A and GPX3, as well as new potential candidates, such as ALOX15, CTSC and CX3CR1. The expression levels of one third of these transcripts were partially or completely corrected following inhaled corticosteroid therapy. CONCLUSION: The study shows that bronchial biopsies obtained from healthy and asthmatic subjects display distinct expression profiles. These differences provide a global view of physiopathologic processes active in the asthmatic lung and may provide invaluable help to clarify the natural history of asthma

    Analyse écorégionale marine de Nouvelle-Calédonie : atelier d'identification des aires de conservation prioritaires

    Dans le cadre de l'initiative pour les récifs coralliens du Pacifique sud (CRISP), le WWF-France a souhaité développer un projet pour la protection des récifs et des lagons néo-calédoniens. L'atelier, qui s'est déroulé les 10 et 11 août à Nouméa, avait pour objectif de rassembler les scientifiques et les experts du lagon néocalédonien pour identifier, sur la base de leur connaissance experte, les zones les plus remarquables du lagon (richesse, endémisme, originalité des faunes et flores, espèces emblématiques, zones d'intérêt fonctionnel) sur lesquelles doivent porter en priorité les efforts de conservation. Il a permis d'identifier 20 aires prioritaires pour la conservation, parmi lesquelles 6 ont un intérêt mondial, 4 ont un intérêt sur le plan régional, les autres ayant un intérêt local

    La ressource E-Calm

    Constituer et analyser un corpus scolaire. L’approche Scoledit

    MIRTO : un système au service de l'enseignement des langues

    Le projet MIRTO (Multi-apprentissages Interactifs par des Recherches sur des Textes et l'Oral) vise la réalisation d'une plateforme d'enseignement de langue(s). MIRTO ambi-tionne à mettre au service des enseignants des logiciels et outils issus du TAL (Traitement Automatique de la Langue) afin de leur permettre la conception et l'exploitation (en présentiel ou à distance) de scenarii pédagogiques enseignant le fonctionnement et la structuration de la langue à travers la diversité et la richesse des corpus textuels ou oraux. MIRTO permet de pointer des problèmes aussi bien en didactique des langues qu'en TAL ou en informatique concernant, par exemple, l'architecture informatique des plateformes d'enseignement, l'adaptation et l'utilisation des logiciels et outils TAL pour l'enseignement des langues, l'apport du TAL à la problématique de la didactique des langues, etc. MIRTO devrait apporter une première solution à ces problèmes et constituer un outil expérimen-al précieux pour la poursuite de la réflexion dans ces domaines ainsi qu'un « point de rencontre » des spécialistes des trois domaines concernés
