1 research outputs found

    Extraction automatique de segments textuels, détection de rôles, de sujets et de polarités

    Get PDF
    Dans cette thèse, nous présentons de nouvelles méthodes permettant l extraction de chaînes de mots (segments textuels) relatives à des catégories (thématiques, rôles des locuteurs, opinions). Nous proposons, dans un premier temps, une méthode basée su rune métrique de recherche de collocations, que nous appliquons de manière distincte sur les documents liés à la même catégorie et qui, par itérations, nous permet d obtenir des chaînes caractéristiques de cette catégorie. Ces chaînes sont alors employées pour améliorer les performances de systèmes de catégorisation de textes ou dans un but d extraction de connaissances (faire ressortir des éléments textuels tels que des expressions employées par un type de locuteurs, des sous-thématiques liées à la catégorie,...). Nous proposons ensuite une seconde méthode permettant de rechercher, dans un corpus d opinions, des n-grammes exprimant des jugements sur des sujets prédéfinis.Nous pouvons alors extraire des segments textuels représentant l expression d une opinion sur un des sujets cibles.Ces méthodes sont validées par un certain nombre d expériences effectuées dans des contextes différents : écrits de blogs, transcriptions manuelles de parole spontanée,critiques de produits culturels, enquêtes de satisfaction EDF, en français ou en anglais, ...Non communiquéAVIGNON-Bib. numérique (840079901) / SudocSudocFranceF
    corecore