LeBenchmark, un référentiel d'évaluation pour le français oral *

Alisamir, Sina; Allauzen, Alexandre; Besacier, Laurent; Dinarelli, Marco; Estève, Yannick; Evain, Solène; Le, Hang; Lecouteux, Benjamin; Mdhaffar, Salima; Nguyen, Ha; Parcollet, Titouan; Portet, François; Ringeval, Fabien; Rossato, Solange; Schwab, Didier; Tomashenko, Natalia; Tong, Ziyi; Zanon Boito, Marcely

LeBenchmark, un référentiel d'évaluation pour le français oral *

Authors: Sina Alisamir
Alexandre Allauzen
Laurent Besacier
Marco Dinarelli
Yannick Estève
Solène Evain
Hang Le
Benjamin Lecouteux
Salima Mdhaffar
Ha Nguyen
Titouan Parcollet
François Portet
Fabien Ringeval
Solange Rossato
Didier Schwab
Natalia Tomashenko
Ziyi Tong
Marcely Zanon Boito
Publication date: 13 June 2022
Publisher: HAL CCSD

Abstract

International audienceL'apprentissage autosupervisé a apporté des améliorations remarquables dans de nombreux domaines tels que la vision par ordinateur ou le traitement de la langue et de la parole, en exploitant de grandes quantités de données non étiquetées. Dans le contexte spécifique de la parole, cependant, et malgré des résultats prometteurs, il existe un manque évident de normalisation dans les processus d'évaluation permettant des comparaisons précises de ces modèles, en particulier pour les autres langues que l'anglais. Nous présentons ici à la communauté francophone LeBenchmark, un cadre de référence en sources ouvertes et reproductible pour évaluer des modèles autosupervisés à partir de corpus de parole en français. Il est composé de quatre tâches : reconnaissance automatique de la parole, compréhension du langage parlé, traduction automatique de la parole et reconnaissance automatique d'émotions. Nous encourageons la communauté francophone à utiliser ce référentiel dans ses futures expérimentations, notamment pour l'évaluation de modèles autosupervisés

Similar works

Full text

Available Versions

Hal - Université Grenoble Alpes

oai:HAL:hal-03767742v1

Last time updated on 08/10/2022