research

Etude d'application des méthodes et des outils statistiques sur les données du corpus ESLO : cas de la question sur mai 68

Abstract

International audienceNotre étude porte sur le corpus ESLO1 (Enquête Socio Linguistique à Orléans) constitué en 1968-69 par des chercheurs britanniques et numérisé, transcrit ensuite par l'équipe du LLL dans le cadre du projet ANR Variling. Nous nous sommes intéressés plus particulièrement au sous-corpus extrait à l'aide de feuilles de style XSLT et composé des réponses à une question posée aux différents locuteurs sur les événements de mai 68. Les fichiers de transcription sur lesquels nous avons travaillé sont des fichiers XML de Transcriber où certaines informations comme le temps de l'énoncé, les métadonnées ou les événements du discours sont annotés à l'aide de balises XML. Chaque locuteur est renseigné dans une base de données contenant son sexe, âge, niveau d'études, etc. Toutes ces informations ont été extraites et traitées avec le logiciel statistique R. Nous avons utilisé l'analyse des méthodes de statistiques descriptives : boîtes à moustaches, analyse des composantes principales, analyse des correspondances multiples, pour mettre en évidence les relations entre des variables numériques comme temps de pause ou durée de la réponse avec des caractéristiques sociologiques sur des locuteurs

    Similar works