International audienceThis paper presents the design of a Language for Specific Pur-poses(LSP) Corpus and its exploitation as a source for real-time visuali-sation of linguistic complexity in learner writings. The corpus is provided with a Natural Language Processing (NLP) tool, called VizLing, used to compute and visualise complexity metrics. The resulting data set is made up of learner writings, metadata and complexity metrics.Les enseignements LANSAD à l’université varient qualitativement. Du fait de facteurs structurels—tels que de larges effectifs, des volumes horaires annuels minimalistes et la dépendance à des statuts précaires—les équipes pédagogiques parfois peu pérennes sont difficilement en mesure d’organiser les étudiants en cohortes autour de programmes pluriannuels aux objectifs détaillés et cohérents. Ces difficultés se retrouvent notamment dans les objectifs linguistiques. Ceux-ci sont en général définis de manière individuelle et au regard de contenus propres à chaque groupe. Cela favorise des approches adaptées aux groupes mais manquant de perspective globale concernant les étapes linguistiques à franchir dans l’apprentissage d’une langue de spécialité. Il conviendrait d’élaborer des programmes incluant des objectifs linguistiques par niveau et domaine spécialisé (Petit, 2010). Une méthode pourrait reposer sur l’exploitation de corpus d’apprenants (Granger, 1994).Cet article vise à décrire un corpus LANSAD recueilli à l’université de X auprès de publics scientifiques dans des domaines allant des sciences informatiques aux sciences de la santé, en L2 anglais, espagnol et allemand. Il contient 398 textes écrits descriptifs et argumentatifs (82 594 tokens) s’articulant autour d’une tâche unique. Grâce à une interface MOODLE, les métadonnées recueillies comprennent notamment des données comportementales et le niveau CECRL obtenu au DIALANG (Alderson & Huhta, 2005). En outre, les textes anglais sont annotés en niveaux CECRL par deux experts. Un test d’accord inter-annotateur a révélé une homogénéité satisfaisante (weighted Kappa = 0.71, n=50). Ce corpus permet l’analyse linguistique de la langue et la mise en évidence de traits linguistiques corrélés aux niveaux d’apprenants (Hawkins & Filipović, 2012). Dans le cadre du LANSAD, son usage permet d’établir une cartographie des traits en fonction des domaines spécialisés, et par la même de formaliser des stades d’interlangue par domaine. De véritables programmes linguistiques LANSAD pourraient voir le jour grâce à des approches ‘corpus driven’ (Boulton, 2017)