63 research outputs found

    Structured Named Entities in two distinct press corpora: Contemporary Broadcast News and Old Newspapers

    No full text
    International audienceThis paper compares the reference annotation of structured named entities in two corpora with different origins and properties. It ad- dresses two questions linked to such a comparison. On the one hand, what specific issues were raised by reusing the same annotation scheme on a corpus that differs from the first in terms of media and that predates it by more than a century? On the other hand, what contrasts were observed in the resulting annotations across the two corpora

    Parole de locuteur (performance et confiance en identification biométrique vocale)

    Get PDF
    Ce travail de thĂšse explore l usage biomĂ©trique de la parole dont les applications sont trĂšs nombreuses (sĂ©curitĂ©, environnements intelligents, criminalistique, surveillance du territoire ou authentification de transactions Ă©lectroniques). La parole est soumise Ă  de nombreuses contraintes fonction des origines du locuteur (gĂ©ographique, sociale et culturelle) mais Ă©galement fonction de ses objectifs performatifs. Le locuteur peut ĂȘtre considĂ©rĂ© comme un facteur de variation de la parole, parmi d autres. Dans ce travail, nous prĂ©sentons des Ă©lĂ©ments de rĂ©ponses aux deux questions suivantes : Tous les extraits de parole d un mĂȘme locuteur sont-ils Ă©quivalents pour le reconnaĂźtre ? Comment se structurent les diffĂ©rentes sources de variation qui vĂ©hiculent directement ou indirectement la spĂ©cificitĂ© du locuteur ? Nous construisons, dans un premier temps, un protocole pour Ă©valuer la capacitĂ© humaine Ă  discriminer un locuteur Ă  partir d un extrait de parole en utilisant les donnĂ©es de la campagne NIST-HASR 2010. La tĂąche ainsi posĂ©e est difficile pour nos auditeurs, qu ils soient naĂŻfs ou plus expĂ©rimentĂ©s.Dans ce cadre, nous montrons que ni la (quasi)unanimitĂ© des auditeurs ni l auto-Ă©valuation de leurs jugements ne sont des gages de confiance dans la vĂ©racitĂ© de la rĂ©ponse soumise.Nous quantifions, dans un second temps, l influence du choix d un extrait de parole sur la performance des systĂšmes automatiques. Nous avons utilisĂ© deux bases de donnĂ©es, NIST et BREF ainsi que deux systĂšmes de RAL, ALIZE/SpkDet (LIA) et Idento (SRI). Les systĂšmes de RAL, aussi bienfondĂ©s sur une approche UBM-GMM que sur une approche i-vector montrent des Ă©carts de performances importants mesurĂ©s Ă  l aide d un taux de variation autour de l EER moyen, Vr (pour NIST, VrIdento = 1.41 et VrALIZE/SpkDet = 1.47 et pour BREF, Vr = 3.11) selon le choix du fichier d apprentissage utilisĂ© pour chaque locuteur. Ces variations de performance, trĂšs importantes, montrent la sensibilitĂ© des systĂšmes automatiques au choix des extraits de parole, sensibilitĂ© qu il est important de mesurer et de rĂ©duire pour rendre les systĂšmes de RAL plus fiables.Afin d expliquer l importance du choix des extraits de parole, nous cherchons les indices les plus pertinents pour distinguer les locuteurs de nos corpus en mesurant l effet du facteur Locuteur sur la variance des indices (h2). La F0 est fortement dĂ©pendante du facteur Locuteur, et ce indĂ©pendamment de la voyelle. Certains phonĂšmes sont plus discriminants pour le locuteur : les consonnes nasales, les fricatives, les voyelles nasales, voyelles orales mi-fermĂ©es Ă  ouvertes.Ce travail constitue un premier pas vers une Ă©tude plus prĂ©cise de ce qu est le locuteur aussi bien pour la perception humaine que pour les systĂšmes automatiques. Si nous avons montrĂ© qu il existait bien une diffĂ©rence cepstrale qui conduisait Ă  des modĂšles plus ou moins performants, il reste encore Ă  comprendre comment lier le locuteur Ă  la production de la parole. Enfin, suite Ă  ces travaux, nous souhaitons explorer plus en dĂ©tail l influence de la langue sur la reconnaissance du locuteur. En effet, mĂȘme si nos rĂ©sultats indiquent qu en anglais amĂ©ricain et en français, les mĂȘmes catĂ©gories de phonĂšmes sont les plus porteuses d information sur le locuteur, il reste Ă  confirmer ce point et Ă  Ă©valuer ce qu il en est pour d autres languesThis thesis explores the use of biometric speech. Speech is subjected to many constraints based on origins of the speaker (geographical , social and cultural ), but also according to his performative goals. The speaker may be regarded as a factor of variation in the speech , among others. In this work, we present some answers to the following two questions:- Are all speech samples equivalent to recognize a speaker?- How are structured the different acoustic cues carrying information about the speaker ?In a first step, a protocol to assess the human ability to discriminate a speaker from a speech sample using NIST-HASR 2010 data is presented. This task is difficult for our listeners who are naive or experienced. In this context, neither the (quasi) unanimity or the self-assessment do not assure the confidence in the veracity of the submitted answer .In a second step, the influence of the choice of a sample speech on the performance of automatic systems is quantified using two databases, NIST and BREF and two systems RAL , Alize / SpkDet (LIA, UBM-GMM system) and Idento (SRI, i-vector system).The two RAL systems show significant differences in performance measured using a measure of relative variation around the average EER, Vr (for NIST Idento Vr = 1.41 and Vr Alize / SpkDet = 1.47 and BREF, Vr = 3.11) depending on the choice of the training file used for each speaker. These very large variations in performance show the sensitivity of automatic systems to the speech sample. This sensitivity must be measured to make the systems more reliable .To explain the importance of the choice of the speech sample and find the relevant cues, the effect of the speaker on the variance of various acoustics features is measured ( 2) . F0 is strongly dependent of the speaker, independently of the vowel. Some phonemes are more discriminative : nasal consonants, fricatives , nasal vowels, oral half closed to open vowels .This work is a first step towards to understand where is the speaker in speech using as well the human perception as automatic systems . If we have shown that there was a cepstral difference between the more and less efficient models, it remains to understand how to bind the speaker to the speech production. Finally, following this work, we wish to explore more in detail the influence of language on speaker recognition. Even if our results indicate that for American English and French , the same categories of phonemes are the carriers of information about the speaker , it remains to confirm this on other languages .AVIGNON-BU Centrale (840072103) / SudocSudocFranceF

    Peri-operative red blood cell transfusion in neonates and infants: NEonate and Children audiT of Anaesthesia pRactice IN Europe: A prospective European multicentre observational study

    Get PDF
    BACKGROUND: Little is known about current clinical practice concerning peri-operative red blood cell transfusion in neonates and small infants. Guidelines suggest transfusions based on haemoglobin thresholds ranging from 8.5 to 12 g dl-1, distinguishing between children from birth to day 7 (week 1), from day 8 to day 14 (week 2) or from day 15 (≄week 3) onwards. OBJECTIVE: To observe peri-operative red blood cell transfusion practice according to guidelines in relation to patient outcome. DESIGN: A multicentre observational study. SETTING: The NEonate-Children sTudy of Anaesthesia pRactice IN Europe (NECTARINE) trial recruited patients up to 60 weeks' postmenstrual age undergoing anaesthesia for surgical or diagnostic procedures from 165 centres in 31 European countries between March 2016 and January 2017. PATIENTS: The data included 5609 patients undergoing 6542 procedures. Inclusion criteria was a peri-operative red blood cell transfusion. MAIN OUTCOME MEASURES: The primary endpoint was the haemoglobin level triggering a transfusion for neonates in week 1, week 2 and week 3. Secondary endpoints were transfusion volumes, 'delta haemoglobin' (preprocedure - transfusion-triggering) and 30-day and 90-day morbidity and mortality. RESULTS: Peri-operative red blood cell transfusions were recorded during 447 procedures (6.9%). The median haemoglobin levels triggering a transfusion were 9.6 [IQR 8.7 to 10.9] g dl-1 for neonates in week 1, 9.6 [7.7 to 10.4] g dl-1 in week 2 and 8.0 [7.3 to 9.0] g dl-1 in week 3. The median transfusion volume was 17.1 [11.1 to 26.4] ml kg-1 with a median delta haemoglobin of 1.8 [0.0 to 3.6] g dl-1. Thirty-day morbidity was 47.8% with an overall mortality of 11.3%. CONCLUSIONS: Results indicate lower transfusion-triggering haemoglobin thresholds in clinical practice than suggested by current guidelines. The high morbidity and mortality of this NECTARINE sub-cohort calls for investigative action and evidence-based guidelines addressing peri-operative red blood cell transfusions strategies. TRIAL REGISTRATION: ClinicalTrials.gov, identifier: NCT02350348

    Parole de locuteur : performance et confiance en identification biométrique vocale

    No full text
    This thesis explores the use of biometric speech. Speech is subjected to many constraints based on origins of the speaker (geographical , social and cultural ), but also according to his performative goals. The speaker may be regarded as a factor of variation in the speech , among others. In this work, we present some answers to the following two questions:- Are all speech samples equivalent to recognize a speaker?- How are structured the different acoustic cues carrying information about the speaker ?In a first step, a protocol to assess the human ability to discriminate a speaker from a speech sample using NIST-HASR 2010 data is presented. This task is difficult for our listeners who are naive or experienced. In this context, neither the (quasi) unanimity or the self-assessment do not assure the confidence in the veracity of the submitted answer .In a second step, the influence of the choice of a sample speech on the performance of automatic systems is quantified using two databases, NIST and BREF and two systems RAL , Alize / SpkDet (LIA, UBM-GMM system) and Idento (SRI, i-vector system).The two RAL systems show significant differences in performance measured using a measure of relative variation around the average EER, Vr (for NIST Idento Vr = 1.41 and Vr Alize / SpkDet = 1.47 and BREF, Vr = 3.11) depending on the choice of the training file used for each speaker. These very large variations in performance show the sensitivity of automatic systems to the speech sample. This sensitivity must be measured to make the systems more reliable .To explain the importance of the choice of the speech sample and find the relevant cues, the effect of the speaker on the variance of various acoustics features is measured (η 2) . F0 is strongly dependent of the speaker, independently of the vowel. Some phonemes are more discriminative : nasal consonants, fricatives , nasal vowels, oral half closed to open vowels .This work is a first step towards to understand where is the speaker in speech using as well the human perception as automatic systems . If we have shown that there was a cepstral difference between the more and less efficient models, it remains to understand how to bind the speaker to the speech production. Finally, following this work, we wish to explore more in detail the influence of language on speaker recognition. Even if our results indicate that for American English and French , the same categories of phonemes are the carriers of information about the speaker , it remains to confirm this on other languages ​​.Ce travail de thĂšse explore l’usage biomĂ©trique de la parole dont les applications sont trĂšs nombreuses (sĂ©curitĂ©, environnements intelligents, criminalistique, surveillance du territoire ou authentification de transactions Ă©lectroniques). La parole est soumise Ă  de nombreuses contraintes fonction des origines du locuteur (gĂ©ographique, sociale et culturelle) mais Ă©galement fonction de ses objectifs performatifs. Le locuteur peut ĂȘtre considĂ©rĂ© comme un facteur de variation de la parole, parmi d’autres. Dans ce travail, nous prĂ©sentons des Ă©lĂ©ments de rĂ©ponses aux deux questions suivantes :– Tous les extraits de parole d’un mĂȘme locuteur sont-ils Ă©quivalents pour le reconnaĂźtre ?– Comment se structurent les diffĂ©rentes sources de variation qui vĂ©hiculent directement ou indirectement la spĂ©cificitĂ© du locuteur ? Nous construisons, dans un premier temps, un protocole pour Ă©valuer la capacitĂ© humaine Ă  discriminer un locuteur Ă  partir d’un extrait de parole en utilisant les donnĂ©es de la campagne NIST-HASR 2010. La tĂąche ainsi posĂ©e est difficile pour nos auditeurs, qu’ils soient naĂŻfs ou plus expĂ©rimentĂ©s.Dans ce cadre, nous montrons que ni la (quasi)unanimitĂ© des auditeurs ni l’auto-Ă©valuation de leurs jugements ne sont des gages de confiance dans la vĂ©racitĂ© de la rĂ©ponse soumise.Nous quantifions, dans un second temps, l’influence du choix d’un extrait de parole sur la performance des systĂšmes automatiques. Nous avons utilisĂ© deux bases de donnĂ©es, NIST et BREF ainsi que deux systĂšmes de RAL, ALIZE/SpkDet (LIA) et Idento (SRI). Les systĂšmes de RAL, aussi bienfondĂ©s sur une approche UBM-GMM que sur une approche i-vector montrent des Ă©carts de performances importants mesurĂ©s Ă  l’aide d’un taux de variation autour de l’EER moyen, Vr (pour NIST, VrIdento = 1.41 et VrALIZE/SpkDet = 1.47 et pour BREF, Vr = 3.11) selon le choix du fichier d’apprentissage utilisĂ© pour chaque locuteur. Ces variations de performance, trĂšs importantes, montrent la sensibilitĂ© des systĂšmes automatiques au choix des extraits de parole, sensibilitĂ© qu’il est important de mesurer et de rĂ©duire pour rendre les systĂšmes de RAL plus fiables.Afin d’expliquer l’importance du choix des extraits de parole, nous cherchons les indices les plus pertinents pour distinguer les locuteurs de nos corpus en mesurant l’effet du facteur Locuteur sur la variance des indices (h2). La F0 est fortement dĂ©pendante du facteur Locuteur, et ce indĂ©pendamment de la voyelle. Certains phonĂšmes sont plus discriminants pour le locuteur : les consonnes nasales, les fricatives, les voyelles nasales, voyelles orales mi-fermĂ©es Ă  ouvertes.Ce travail constitue un premier pas vers une Ă©tude plus prĂ©cise de ce qu’est le locuteur aussi bien pour la perception humaine que pour les systĂšmes automatiques. Si nous avons montrĂ© qu’il existait bien une diffĂ©rence cepstrale qui conduisait Ă  des modĂšles plus ou moins performants, il reste encore Ă  comprendre comment lier le locuteur Ă  la production de la parole. Enfin, suite Ă  ces travaux, nous souhaitons explorer plus en dĂ©tail l’influence de la langue sur la reconnaissance du locuteur. En effet, mĂȘme si nos rĂ©sultats indiquent qu’en anglais amĂ©ricain et en français, les mĂȘmes catĂ©gories de phonĂšmes sont les plus porteuses d’information sur le locuteur, il reste Ă  confirmer ce point et Ă  Ă©valuer ce qu’il en est pour d’autres langue

    ThĂ©Ăątre public et dĂ©mocratisation culturelle : l'impact de la politique des relais sur la diversification des publics. EnquĂȘte sur les spectateurs-relais du TNP de Villeurbanne

    No full text
    L'auteur a apportĂ© des modifications Ă  son mĂ©moire aprĂšs la soutenance. La version mise en ligne est la version corrigĂ©e.Ce mĂ©moire de master 2 professionnel effectuĂ© dans le cadre du Master « Diffusion de la culture » se propose d’étudier les moyens mis en Ɠuvre par le service des relations avec le public du ThĂ©Ăątre National Populaire de Villeurbanne en matiĂšre de diversification des publics dans l’optique de mesurer les enjeux et les limites de la politique des relais.Ce mĂ©moire s’articule en trois parties. La premiĂšre est consacrĂ©e Ă  la prĂ©sentation du ThĂ©Ăątre National Populaire, structure au sein de laquelle j’ai effectuĂ© mon stage. La seconde prĂ©sente les diffĂ©rentes missions qui m’ont Ă©tĂ© confiĂ©es au cours des six mois effectuĂ©s au sein du service des relations avec le public. La troisiĂšme, dite de « recherche », relate la rĂ©flexion que j’ai pu mener autour du thĂšme des spectateurs-relais comme moyen de diversification des publics. Ma rĂ©flexion s’est principalement fondĂ©e sur les matĂ©riaux rĂ©coltĂ©s au cours d’une dizaine d’entretiens rĂ©alisĂ©s avec des spectateurs-relais du TNP rattachĂ©s aux secteurs suivants : associations, enseignement supĂ©rieur, collectivitĂ©s, comitĂ©s d’entreprises, ainsi que « grand public ». L’axe de travail principal de ce mĂ©moire porte sur les moyens de toucher un public le plus large et le plus diversifiĂ© possible dans une perspective de dĂ©mocratisation culturelle.J’ai tout d’abord tentĂ© de dĂ©finir les notions de spectateur et de spectateur-relais, afin de voir en quoi le spectateur-relais pouvait constituer un levier de popularisation du thĂ©Ăątre. Je me suis Ă©galement appuyĂ©e sur une expĂ©rience de terrain que j’ai effectuĂ©e autour de la recherche de nouveaux Ă©tudiants-relais, pour ensuite analyser les donnĂ©es recueillies lors des entretiens avec des spectateurs-relais.Se dĂ©gage principalement l’idĂ©e que les spectateurs-relais favorisent la venue au thĂ©Ăątre de personnes qui, d’elles-mĂȘmes, n’auraient pas fait la dĂ©marche de s’y rendre. La notion de sociabilitĂ© Ă©tant fortement liĂ©e Ă  la sortie au thĂ©Ăątre, la venue en groupe peut ainsi influencer et favoriser les pratiques des spectateurs. On peut par consĂ©quent affirmer que le dispositif des spectateurs-relais permet une diversification des publics, Ă  condition que les relais eux-mĂȘmes appartiennent Ă  des catĂ©gories socioculturelles variĂ©es

    Speaker in speech : performance and confidence in voice biometric identification

    No full text
    Ce travail de thĂšse explore l’usage biomĂ©trique de la parole dont les applications sont trĂšs nombreuses (sĂ©curitĂ©, environnements intelligents, criminalistique, surveillance du territoire ou authentification de transactions Ă©lectroniques). La parole est soumise Ă  de nombreuses contraintes fonction des origines du locuteur (gĂ©ographique, sociale et culturelle) mais Ă©galement fonction de ses objectifs performatifs. Le locuteur peut ĂȘtre considĂ©rĂ© comme un facteur de variation de la parole, parmi d’autres. Dans ce travail, nous prĂ©sentons des Ă©lĂ©ments de rĂ©ponses aux deux questions suivantes :– Tous les extraits de parole d’un mĂȘme locuteur sont-ils Ă©quivalents pour le reconnaĂźtre ?– Comment se structurent les diffĂ©rentes sources de variation qui vĂ©hiculent directement ou indirectement la spĂ©cificitĂ© du locuteur ? Nous construisons, dans un premier temps, un protocole pour Ă©valuer la capacitĂ© humaine Ă  discriminer un locuteur Ă  partir d’un extrait de parole en utilisant les donnĂ©es de la campagne NIST-HASR 2010. La tĂąche ainsi posĂ©e est difficile pour nos auditeurs, qu’ils soient naĂŻfs ou plus expĂ©rimentĂ©s.Dans ce cadre, nous montrons que ni la (quasi)unanimitĂ© des auditeurs ni l’auto-Ă©valuation de leurs jugements ne sont des gages de confiance dans la vĂ©racitĂ© de la rĂ©ponse soumise.Nous quantifions, dans un second temps, l’influence du choix d’un extrait de parole sur la performance des systĂšmes automatiques. Nous avons utilisĂ© deux bases de donnĂ©es, NIST et BREF ainsi que deux systĂšmes de RAL, ALIZE/SpkDet (LIA) et Idento (SRI). Les systĂšmes de RAL, aussi bienfondĂ©s sur une approche UBM-GMM que sur une approche i-vector montrent des Ă©carts de performances importants mesurĂ©s Ă  l’aide d’un taux de variation autour de l’EER moyen, Vr (pour NIST, VrIdento = 1.41 et VrALIZE/SpkDet = 1.47 et pour BREF, Vr = 3.11) selon le choix du fichier d’apprentissage utilisĂ© pour chaque locuteur. Ces variations de performance, trĂšs importantes, montrent la sensibilitĂ© des systĂšmes automatiques au choix des extraits de parole, sensibilitĂ© qu’il est important de mesurer et de rĂ©duire pour rendre les systĂšmes de RAL plus fiables.Afin d’expliquer l’importance du choix des extraits de parole, nous cherchons les indices les plus pertinents pour distinguer les locuteurs de nos corpus en mesurant l’effet du facteur Locuteur sur la variance des indices (h2). La F0 est fortement dĂ©pendante du facteur Locuteur, et ce indĂ©pendamment de la voyelle. Certains phonĂšmes sont plus discriminants pour le locuteur : les consonnes nasales, les fricatives, les voyelles nasales, voyelles orales mi-fermĂ©es Ă  ouvertes.Ce travail constitue un premier pas vers une Ă©tude plus prĂ©cise de ce qu’est le locuteur aussi bien pour la perception humaine que pour les systĂšmes automatiques. Si nous avons montrĂ© qu’il existait bien une diffĂ©rence cepstrale qui conduisait Ă  des modĂšles plus ou moins performants, il reste encore Ă  comprendre comment lier le locuteur Ă  la production de la parole. Enfin, suite Ă  ces travaux, nous souhaitons explorer plus en dĂ©tail l’influence de la langue sur la reconnaissance du locuteur. En effet, mĂȘme si nos rĂ©sultats indiquent qu’en anglais amĂ©ricain et en français, les mĂȘmes catĂ©gories de phonĂšmes sont les plus porteuses d’information sur le locuteur, il reste Ă  confirmer ce point et Ă  Ă©valuer ce qu’il en est pour d’autres languesThis thesis explores the use of biometric speech. Speech is subjected to many constraints based on origins of the speaker (geographical , social and cultural ), but also according to his performative goals. The speaker may be regarded as a factor of variation in the speech , among others. In this work, we present some answers to the following two questions:- Are all speech samples equivalent to recognize a speaker?- How are structured the different acoustic cues carrying information about the speaker ?In a first step, a protocol to assess the human ability to discriminate a speaker from a speech sample using NIST-HASR 2010 data is presented. This task is difficult for our listeners who are naive or experienced. In this context, neither the (quasi) unanimity or the self-assessment do not assure the confidence in the veracity of the submitted answer .In a second step, the influence of the choice of a sample speech on the performance of automatic systems is quantified using two databases, NIST and BREF and two systems RAL , Alize / SpkDet (LIA, UBM-GMM system) and Idento (SRI, i-vector system).The two RAL systems show significant differences in performance measured using a measure of relative variation around the average EER, Vr (for NIST Idento Vr = 1.41 and Vr Alize / SpkDet = 1.47 and BREF, Vr = 3.11) depending on the choice of the training file used for each speaker. These very large variations in performance show the sensitivity of automatic systems to the speech sample. This sensitivity must be measured to make the systems more reliable .To explain the importance of the choice of the speech sample and find the relevant cues, the effect of the speaker on the variance of various acoustics features is measured (η 2) . F0 is strongly dependent of the speaker, independently of the vowel. Some phonemes are more discriminative : nasal consonants, fricatives , nasal vowels, oral half closed to open vowels .This work is a first step towards to understand where is the speaker in speech using as well the human perception as automatic systems . If we have shown that there was a cepstral difference between the more and less efficient models, it remains to understand how to bind the speaker to the speech production. Finally, following this work, we wish to explore more in detail the influence of language on speaker recognition. Even if our results indicate that for American English and French , the same categories of phonemes are the carriers of information about the speaker , it remains to confirm this on other languages ​​

    Do Humans and speaker verification system use the same information to differentiate voices?

    No full text
    International audienceThe aim of this paper is to analyze the pairwise comparisons of voices by a speaker verification system (ALIZE/Spk) and by human. A database of familial groups of 24 speakers was created. A single sentence was chosen for the perception test. The same sentence was used the test signal for the ALIZE/Spk trained on another part of the corpus. Results shows that the voice proximities within a familial group were well recovered in the speaker representation by ALIZE and much less returned in the representation from perception tes

    Do Human and Automatic systems use the same information to recognize voices ?

    No full text
    International audienceno abstrac
    • 

    corecore