4 research outputs found

    Identification de personnes dans des flux multimédia

    No full text
    International audienceThis paper describes a multi-modal person recognition system for video broadcastdeveloped for participating to the REPERE challenge, that was organized jointly by the DGA and the ANR (French Research National Agency). The main track of this challenge targets the identification of all persons occurring in a video either. The main scientific issue addressed by this challenge is the combination of audio and video information extraction processes for improving the extraction performance in both modalities. In this paper, we present a strategy for speaker identification based on enriching the speaker diarization by features related to the ”understanding” of the video scenes: text overlay transcription and analysis, automatic situation identification (TV set, report), the amount of people visible, TV set disposition and even the camera when available. Experiments on the REPERE corpus show interest of the proposed approach.Cet article prĂ©sente un systĂšme d’identification de personnes dans des flux multimĂ©dia.Ce systĂšme a Ă©tĂ© engagĂ© dans le dĂ©fi REPERE, co-organisĂ© par l’ANR et la DGA et qui s’est terminĂ© en 2014. La tĂąche principale du dĂ©fi consistait Ă  identifier des individus apparaissant dans au moins une des modalitĂ©s portĂ©es par la vidĂ©o, qu’il s’agisse de locuteurs audibles ou de visages visibles Ă  l’écran. Un des verrous scientifiques majeurs de cette tĂąche est liĂ© Ă  la combinaison des modalitĂ©s audio et vidĂ©o. Cet article prĂ©sente une stratĂ©gie pour la reconnaissance des personnes basĂ©e sur une identification du locuteur reposant sur des descripteurs dehaut niveau, modĂ©lisant diffĂ©rents aspects de la scĂšne filmĂ©e : la transcription et l’analyse des textes incrustĂ©s, l’identification du type de la scĂšne filmĂ©e (reportage, plateau, ...), le nombre de personnes prĂ©sentes, la disposition des camĂ©ras... Nos expĂ©riences sur le corpus REPERE montrent l’intĂ©rĂȘt de l’approche proposĂ©e

    Identification de personnes dans des flux multimédia

    No full text
    International audienceThis paper describes a multi-modal person recognition system for video broadcastdeveloped for participating to the REPERE challenge, that was organized jointly by the DGA and the ANR (French Research National Agency). The main track of this challenge targets the identification of all persons occurring in a video either. The main scientific issue addressed by this challenge is the combination of audio and video information extraction processes for improving the extraction performance in both modalities. In this paper, we present a strategy for speaker identification based on enriching the speaker diarization by features related to the ”understanding” of the video scenes: text overlay transcription and analysis, automatic situation identification (TV set, report), the amount of people visible, TV set disposition and even the camera when available. Experiments on the REPERE corpus show interest of the proposed approach.Cet article prĂ©sente un systĂšme d’identification de personnes dans des flux multimĂ©dia.Ce systĂšme a Ă©tĂ© engagĂ© dans le dĂ©fi REPERE, co-organisĂ© par l’ANR et la DGA et qui s’est terminĂ© en 2014. La tĂąche principale du dĂ©fi consistait Ă  identifier des individus apparaissant dans au moins une des modalitĂ©s portĂ©es par la vidĂ©o, qu’il s’agisse de locuteurs audibles ou de visages visibles Ă  l’écran. Un des verrous scientifiques majeurs de cette tĂąche est liĂ© Ă  la combinaison des modalitĂ©s audio et vidĂ©o. Cet article prĂ©sente une stratĂ©gie pour la reconnaissance des personnes basĂ©e sur une identification du locuteur reposant sur des descripteurs dehaut niveau, modĂ©lisant diffĂ©rents aspects de la scĂšne filmĂ©e : la transcription et l’analyse des textes incrustĂ©s, l’identification du type de la scĂšne filmĂ©e (reportage, plateau, ...), le nombre de personnes prĂ©sentes, la disposition des camĂ©ras... Nos expĂ©riences sur le corpus REPERE montrent l’intĂ©rĂȘt de l’approche proposĂ©e
    corecore