3 research outputs found

    " Quand rédiger c'est décrire " : Mise en forme matérielle des textes et construction d'ontologies à partir de textes

    Get PDF
    National audienceLa construction d'ontologie à partir de textes met classiquement en oeuvre des outils issus du Traitement Automatique de la Langue et/ou des outils d'apprentissage supervisé ou non. Dans cet article nous revenons sur la possibilité d'exploiter des objets textuels à la fois facilement identifiables, souvent fertiles en connaissances ontologiques, et dont la sémantique peut clairement être explicitée par les théories du discours : les structures énumératives. Ici, nous ajoutons une nouvelle classe de relations sémantiques portée par les structures énumératives très présentes dans nos corpus : les relations lexicales telles que l'homonymie ou la synonymie. Ces relations semblent propices pour alimenter la facette terminologique d'une Ressource Termino-Ontologique. Nous montrons que ces relations peuvent être formellement caractérisées. Une évaluation de notre approche à partir d'un corpus annoté manuellement nous permet de valider notre position, ce qui constitue une première étape vers un outil d'apprentissage supervisé pour la construction d'ontologie à partir de texte

    Identification de relations sémantiques portées par les structures énumératives paradigmatiques : une approche symbolique et une approche par apprentissage supervisé

    No full text
    International audienceUn texte est une suite de phrases dont la cohérence sémantique et rhétorique doit être assurée par des relations du discours. Un texte met aussi en œuvre un ensemble de moyens typographiques, de ponctuations et d'agencements qui contribuent, eux aussi, à identifier son sens. Ces deux propriétés ont été respectivement formalisées, par différentes théories du discours, et par des modèles de structure de textes. Les correspondances entre les représentations des structures du discours et les mises en forme des textes ne sont pas généralement bijectives. Néanmoins, certaines structures discursives comme les structures énumératives profitent de cette correspondance. Ces dernières ont des caractéristiques de typographie, de ponctuation ou/et de disposition qui (1) les rendent facilement repérables et (2) traduisent des relations hiérarchiques. Dans cet article nous montrons, à l'aide de deux approches, comment les objets textuels ayant les propriétés (1) et (2) peuvent être exploités pour améliorer considérablement le processus d'enrichissement de ressources termino-ontologiques à partir de textes. Deux approches, l'une symbolique et l'autre par apprentissage supervisé ont été mises en œuvre. Les avantages et limites de ces approches font l'objet d'une discussion en fin d'article
    corecore