Wikiconflits, un corpus extrait de Wikipédia : principe et méthode d'élaboration

Abstract

Le groupe CoMeRe-nouvelles-acquisitions-Wikipédia a constitué un corpus de pages Wikipédia, le corpus Wikiconflits (https://repository.ortolang.fr/api/content/comere/v2/cmr-wikiconflits.html) qui a été adjoint au corpus CoMeRe afin d’améliorer sa représentativité. Son choix s’est porté autour de l'observation de pages ayant suscité des discussions conflictuelles autour de controverses dans les champs des sciences et des techniques. Dans une première partie, le groupe explique sa méthode de sélection des discussions conflictuelles. Dans les parties suivantes, le groupe CoMeRe-LRL expose la méthode de constitution du corpus en fonction des critères précédemment retenus et la façon de les transformer en TEI. Ce rapport se termine par la présentation de l'outil WikiTool développé lors des traitements. Mis à disposition sous licence libre il permet d'extraire des pages dans les fichiers de type Dump de Wikipedia

Similar works

This paper was published in HAL Clermont Université.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.