GeoNLPlify : Une augmentation spatiale de corpus liés aux crises pour des tâches de classification

Abstract

International audienceL'article "Deux cygnes retrouvés mort au Parc de la Tête d'Or à Lyon" parle-t-il de l'épidémie de grippe aviaire ? Nos travaux proposent d'utiliser l'information spatiale pour générer des données artificielles étiquetées afin d'améliorer les classifications de textes basées sur BERT. Ainsi, après avoir mis en évidence, par des méthodes d'explicabilité, l'importance de l'information spatiale dans les corpus liés à des crises, nous proposons différentes stratégies d'augmentation de données qui tirent profit de ce constat. Notre méthode, GeoNLPlify, est évaluée sur des jeux de données publics (PADI-web et Cri-sisNLP) et comparée aux augmentations de données classiques

    Similar works

    Full text

    thumbnail-image

    Available Versions

    Last time updated on 31/10/2023