research

Sud4science, de l'acquisition d'un grand corpus de SMS en français à l'analyse de l'écriture SMS

Abstract

International audienceThis article describes the sud4science project (www.sud4science.org). Firstly, the authors present the acquisition phase of both SMS data and questionnaire data. Secondly, they explain anonymisation techniques, transcoding and optional annotation phases. Finally, they propose preliminary (socio-) linguistic analyses of scriptural usage of SMS writing, and they also indicate those that are planned in the foreseeable future.Dans le cadre de cet article, on expose le déroulement du projet sud4science (www.sud4science.org). En premier lieu, on décrit la phase d'acquisition des données en provenance des SMS et du questionnaire, avant d'aborder les étapes successives d'anonymisation, de transcodage et d'annotation optionnelle. Ensuite, on présente les analyses (socio-)linguistiques des pratiques scripturales de l'écriture SMS (eSMS) qui ont débuté, ainsi que celles prévues à court et à moyen terme

    Similar works