Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient

Bellamine, Ali; Gilavert, Clément; Gérardin, Christel; Kempf, Emmanuelle; Tannier, Xavier; Vaillant, Pascal; Wajsbürt, Perceval

Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient

Authors: Ali Bellamine
Clément Gilavert
Christel Gérardin
Emmanuelle Kempf
Xavier Tannier
Pascal Vaillant
Perceval Wajsbürt
Publication date: 1 January 2021
Publisher: 'Associacio catalana de Salut Laboral'

Abstract

International audienceLa première tâche du Défi fouille de textes 2021 a consisté à extraire automatiquement, à partir de cas cliniques, les phénotypes pathologiques des patients regroupés par tête de chapitre du MeSH-maladie. La solution présentée est celle d’un classifieur multilabel basé sur un transformer. Deux transformers ont été utilisés : le camembert-large classique (run 1) et le camembert-large fine-tuné (run 2) sur des articles biomédicaux français en accès libre. Nous avons également proposé un modèle « bout-enbout », avec une première phase d’extraction d’entités nommées également basée sur un transformer de type camembert-large et un classifieur de genre sur un modèle Adaboost. Nous obtenons un très bon rappel et une précision correcte, pour une F1-mesure autour de 0,77 pour les trois runs. La performance du modèle « bout-en-bout » est similaire aux autres méthodes

Similar works

Full text

Available Versions

HAL-Inserm

oai:HAL:hal-03265917v1

Last time updated on 27/12/2021

HAL-Paris 13

oai:HAL:hal-03265917v1

Last time updated on 27/12/2021