5 research outputs found

    Détection et classification automatiques d'erreurs de prononciation en L2 : approche basée sur les connaissances didactiques

    No full text
    National audienceLes outils d’EntraĂźnement Ă  la Prononciation AssistĂ© par Ordinateur (EPAO) sont intĂ©ressants pour l’apprentissage des langues dans la mesure oĂč la majoritĂ© des apprenants n’a pas accĂšs Ă  un professeur particulier pour travailler ces aspects. Ces outils doivent ĂȘtre capables d’effectuer la dĂ©tection et le diagnostic des erreurs de prononciation avec suffisamment de fiabilitĂ© et de prĂ©cision pour pouvoir fournir Ă  l’apprenant des retours pertinents vis-Ă -vis des difficultĂ©s qu’il rencontre. Dans ce domaine, nombre de travaux s’appuient sur un alignement forcĂ© du signal de parole avec la prononciation canonique, ce qui permet d’évaluer les sons produits en connaissant les phones canoniques auxquels ils correspondent. La mĂ©thode la plus citĂ©e est le Goodness of Pronunciation (GOP) [1], mais des mĂ©thodes plus rĂ©centes emploient des classifieurs basĂ©s sur des rĂ©seaux de neurones profonds ou des reprĂ©sentations issues de rĂ©seaux de neurones comme wav2vec 2.0 [2]. D’autres mĂ©thodes se basent sur une transcription phonĂ©tique suivie d’une comparaison avec la prononciation canonique, ce qui permet de fournir un diagnostic d’erreur. Dans [3] les auteurs effectuent la phase de reconnaissance de phones selon deux architectures basĂ©es sur des Transformers. Le meilleur systĂšme obtient 81,3% de prĂ©cision et 80,7% de rappel pour la dĂ©tection et 10,0% d’erreur de diagnostic sur le corpus CU-CHLOE d’apprenants chinois de l’anglais.Dans le cadre de nos travaux, nous nous plaçons dans le contexte d’une tĂąche de rĂ©pĂ©tition de mots ou de phrases simples, sur la base de stimuli audio prĂ©sentĂ©s aux apprenants. La prononciation correcte est connue et contient une difficultĂ© Ă  leur faire travailler. Les rĂ©alisations probables du phonĂšme cible sont classĂ©es dans des catĂ©gories didactiques correspondant aux retours qu’un enseignant fournirait selon la prĂ©sence et le type d’erreurs. Nous explorons deux approches qui se basent sur les deux tendances observĂ©es dans la littĂ©rature : l’une repose sur un alignement entre la prononciation cible et la production, et l’autre se base sur une transcription phonĂ©tique de la production.La premiĂšre approche rĂ©alise d’abord un alignement entre signaux avec l’algorithme Dynamic Time Warping (DTW), en utilisant des MFCC. Le segment de la production correspondant au phonĂšme cible est ensuite classĂ© dans l’une des catĂ©gories didactiques identifiĂ©es, en utilisant diverses mesures tirĂ©es de la littĂ©rature et un classifieur hiĂ©rarchique binaire basĂ© sur la mĂ©thode des random forest. L’intĂ©rĂȘt de cette approche est qu’elle est indĂ©pendante de la langue.La seconde approche rĂ©alise une transcription phonĂ©tique de la production Ă  l’aide d’un rĂ©seau rĂ©current bidirectionnel Ă  mĂ©moire courte et long terme (BiLSTM) [4] prĂ©-entraĂźnĂ© sur de la parole native de la L1 et de la L2 puis adaptĂ© Ă  la parole d’apprenants. La transcription est ensuite alignĂ©e avec la prononciation cible via un alignement de Needleman-Wunsch [5]. La rĂ©alisation correspondant au phonĂšme cible est alors classĂ©e dans la catĂ©gorie didactique avec laquelle elle est la plus similaire (selon des critĂšres de similaritĂ© entre phones inspirĂ©s de [6]). Avec cette approche, l’utilisation de transfer learning permet de gĂ©rer le manque de donnĂ©es d’entraĂźnement.Notre Ă©tude a Ă©tĂ© rĂ©alisĂ©e sur un corpus de 7112 Ă©noncĂ©s produits par 67 apprenants japonais du français et annotĂ©s au niveau phonĂ©tique par deux experts. Notre Ă©tude se limite pour l’instant aux phonĂšmes /ʒ/ et /y/, jugĂ©s parmi les plus importants pour l’apprentissage du français par des japonophones. Nous disposons ainsi de 1540 rĂ©alisations de /ʒ/ et de 1183 rĂ©alisations de /y/.Pour le phonĂšme /ʒ/, les rĂ©sultats sont encourageants, avec des prĂ©cisions assez Ă©levĂ©es sur les deux catĂ©gories les plus frĂ©quentes. Le systĂšme basĂ© sur la transcription par un BiLSTM donne les meilleurs rĂ©sultats. Nous obtenons ainsi une prĂ©cision moyenne de 83,8% sur ces catĂ©gories. Pour le phonĂšme /y/, les rĂ©sultats sont moins bons, avec des prĂ©cisions moins Ă©levĂ©es sur les catĂ©gories d’erreur les plus frĂ©quentes. Le systĂšme basĂ© sur un alignement entre signaux et un classifieur hiĂ©rarchique binaire donne les meilleurs rĂ©sultats. On dĂ©tecte certes les prononciations correctes avec une prĂ©cision de 96,7% mais la prĂ©cision moyenne sur les catĂ©gories d’erreurs les plus frĂ©quentes est de seulement 57,7%. Ces diffĂ©rences peuvent s’expliquer en partie par les diffĂ©rences de distribution des catĂ©gories entre les phonĂšmes : pour /ʒ/ le corpus compte 647 prononciations correctes et 862 reprĂ©sentants de la principale catĂ©gorie d’erreur, ce qui est assez Ă©quilibrĂ©. Par contre, pour /y/, il y a 869 prononciations correctes, mais seulement 151 et 87 reprĂ©sentants pour les deux catĂ©gories d’erreurs les plus frĂ©quentes.Cette premiĂšre Ă©tude, son application Ă  une paire de langues donnĂ©e (Japonais/Français) et aux phonĂšmes cibles faisant l’objet de difficultĂ©s typiques de cet apprentissage, a permis d’explorer deux approches potentiellement complĂ©mentaires pour la dĂ©tection et de diagnostic d’erreurs de prononciation. Les rĂ©sultats prometteurs vont se poursuivre par le prise en compte d’autres phonĂšmes cible. La mĂ©thodologie proposĂ©e peut Ă©galement ĂȘtre gĂ©nĂ©ralisĂ©e Ă  d’autres L1 ou d’autres paires de langues

    Del17p without TP53 mutation confers poor prognosis in intensively treated newly diagnosed multiple myeloma patients

    No full text
    International audienceDespite tremendous improvements in the outcome of patients with multiple myeloma (MM) in the past decade, high-risk patients have not benefited from the approval of novel drugs. The most important prognostic factor is the loss of parts of the short arm of chromosome 17, known as deletion 17p (del(17p)). A recent publication (on a small number of patients) suggested that these patients are at very high-risk only if del(17p) is associated with TP53 mutations, the so-called "double-hit" population. To validate this finding, we designed a much larger study on 121 patients presenting del(17p) in >55% of their plasma cells, and homogeneously treated by an intensive approach. For these 121 patients, we performed deep next generation sequencing targeted on TP53. The outcome was then compared to a large control population (2505 patients lacking del(17p)). Our results confirmed that the "double hit" situation is the worst (median survival = 36 months), but that del(17p) alone also confers a poor outcome compared with the control cohort (median survival = 52.8 months vs 152.2 months, respectively). In conclusion, our study clearly confirms the extremely poor outcome of patients displaying "double hit", but also that del(17p) alone is still a very high-risk feature, confirming its value as a prognostic indicator for poor outcome

    Primary plasma cell leukemias displaying t(11;14) have specific genomic, transcriptional, and clinical features

    No full text
    International audiencePrimary plasma cell leukemia (pPCL) is an aggressive form of multiple myeloma (MM) that has not benefited from recent therapeutic advances in the field. Because it is very rare and heterogeneous, it remains poorly understood at the molecular level. To address this issue, we performed DNA and RNA sequencing of sorted plasma cells from a large cohort of 90 newly diagnosed pPCL and compared with MM. We observed that pPCL presents a specific genomic landscape with a high prevalence of t(11;14) (about half) and high-risk genomic features such as del(17p), gain 1q, and del(1p32). In addition, pPCL displays a specific transcriptome when compared with MM. We then wanted to characterize specifically pPCL with t(11;14). We observed that this subentity displayed significantly fewer adverse cytogenetic abnormalities. This translated into better overall survival when compared with pPCL without t(11;14) (39.2 months vs 17.9 months, P 5 .002). Finally, pPCL with t(11;14) displayed a specific transcriptome, including differential expression of BCL2 family members. This study is the largest series of patients with pPCL reported so far

    Animal symbolisĂ©, animal exploitĂ© : du PalĂ©olithique Ă  la Protohistoire. Actes du 141Ăšme CongrĂšs du CTHS « L’animal et l’homme », Rouen, 11-16 avril 2016

    Get PDF
    International audienceLes dix-neuf textes que comporte ce volume sont issus du colloque organisĂ© dans le cadre du 141Ăšme CongrĂšs du CTHS « L’animal et l’homme » qui s’est dĂ©roulĂ© Ă  Rouen du 11 au 16 avril 2016. ProposĂ© par la section prĂ©histoire et protohistoire du CTHS, ce colloque avait pour objectif d’aborder les relations Homme/Animal sous ses multiples facettes, depuis le PalĂ©olithique jusqu’à l’Âge du Fer. La trentaine de communications proposĂ©e lors de ces journĂ©es a portĂ© sur cinq grandes thĂ©matiques « L’animal ressource », « Entre chien et loup : de la bĂȘte fĂ©roce Ă  l’animal familier », « Les animaux vus et perçus par les PalĂ©olithiques », « La vie et la mort partagĂ©e », « PrĂ©-histoire des Ă©changes de pathogĂšnes »
    corecore