1,342 research outputs found

    Annotation sémantique de pages web

    Get PDF
    National audienceCet article prĂ©sente un systĂšme automatique d'annotation sĂ©mantique de pages web. Les systĂšmes d'annotation automatique existants sont essentiellement syntaxiques, mĂȘme lorsque les travaux visent Ă  produire une annotation sĂ©mantique. La prise en compte d'informations sĂ©mantiques sur le domaine pour l'annotation d'un Ă©lĂ©ment dans une page web Ă  partir d'une ontologie suppose d'aborder conjointement deux problĂšmes : (1) l'identification de la structure syntaxique caractĂ©risant cet Ă©lĂ©ment dans la page web et (2) l'identification du concept le plus spĂ©cifique (en termes de subsumption) dans l'ontologie dont l'instance sera utilisĂ©e pour annoter cet Ă©lĂ©ment. Notre dĂ©marche repose sur la mise en oeuvre d'une technique d'apprentissage issue initialement des wrappers que nous avons articulĂ©e avec des raisonnements exploitant la structure formelle de l'ontologie

    Construction d'ontologies à partir d'une collection de pages web structurées

    Get PDF
    MoanoDe nombreuses collections de documents disponibles sur le web dĂ©crivent les caractĂ©ristiques d'entitĂ©s d'un mĂȘme type (e.g. des produits, des plantes), chaque page prĂ©sentant une de ces entitĂ©s. Ces documents sont des sources de connaissances particuliĂšrement adaptĂ©es pour la construction d'ontologies. Alors qu'ils partagent une mĂȘme mise en forme rĂ©guliĂšre, ils contiennent moins de texte rĂ©digĂ© que des fichiers textes mais leur architecture est riche de sens. De ce fait, les mĂ©thodes linguistiques classiques pour identifier des concepts et des relations sont moins adaptĂ©es pour les analyser. Nous proposons une approche exploitant les diverses propriĂ©tĂ©s de ces documents, combinant analyse de la structure et de la mise en forme avec une analyse linguistique, et exploitant leur annotation sĂ©mantique

    Semantic Annotation of Documents: A Comparative Study

    Full text link
    Semantic annotation, which is considered one of the semantic web applicative aspects, has been adopted by researchers from different communities as a paramount solution that improves searching and retrieval of information by promoting the richness of the content. However, researchers are facing challenges concerning both the quality and the relevance of the semantic annotations attached to the annotated document against its content as well as its semantics, without ignoring those regarding automation process which is supposed to ensure an optimal system for information indexing and retrieval. In this article, we will introduce the semantic annotation concept by presenting a state of the art including definitions, features and a classification of annotation systems. Systems and proposed approaches in the field will be cited, as well as a study of some existing annotation tools. This study will also pinpoint various problems and limitations related to the annotation in order to offer solutions for our future work

    Donner du sens à des documents semi-structurés : de la construction d'ontologies à l'annotation sémantique

    Get PDF
    Chapitre 05 : Donner du sens Ă  des documents semi-structurĂ©s : de la construction d'ontologies Ă  l'annotation sĂ©mantiqueNational audiencePartie 1 : construction et peuplement d'ontologies à partir de textes : démarche générale - critères de bonne structuration d'une ontologie - outils de Traitement Automatique des Langues pour faciliter la construction d'ontologies - ouvertures Partie 2 : "donner du sens" à des contenus : l'annotation sémantique : associer des données et des modèles sémantiques - démarche générale - quel type de ressource pour caractériser "sémantiquement" des contenus/ des données ? - où l'on retrouve le TAL / ouverture

    Une nouvelle méthode de Web Usage Mining basée sur une analyse sémiotique du comportement de navigation

    No full text
    International audienceL’objectif de nos travaux est de proposer une mĂ©thode d’analyse automatique du comportement des utilisateurs Ă  des fins de prĂ©diction de leur propension Ă  rĂ©aliser une action suggĂ©rĂ©e. Nous proposons dans cet article une nouvelle mĂ©thode de Web Usage Mining basĂ©e sur une Ă©tude sĂ©miotique des styles perceptifs, considĂ©rant l’expĂ©rience de l’utilisateur comme Ă©lĂ©ment dĂ©terminant de sa rĂ©action Ă  une sollicitation. L’étude de ces styles nous a amenĂ© Ă  dĂ©finir de nouveaux indicateurs (des descripteurs sĂ©miotiques) introduisant un niveau supplĂ©mentaire Ă  l’approche sĂ©mantique d’annotation des sites. Nous proposons ensuite un modĂšle neuronal adaptĂ© au traitement de ces nouveaux indicateurs. Nous expliquerons en quoi le modĂšle proposĂ© est le plus pertinent pour traiter ces informations

    Prise en compte de l'imperfection des tags pour la classification sémantique d'images

    Get PDF
    Session "Articles"National audienceL'annotation d'images consiste Ă  dĂ©crire le contenu des images en utilisant un nombre fini de concepts fixĂ©s a priori. En pratique, nous utilisons deux modalitĂ©s pour cela : l'image et les tags utilisateurs qui les accompagnent. Cependant, ces tags sont en gĂ©nĂ©ral imparfaits et seulement une partie est pertinente vis-Ă -vis du contenu de l'image. Dans ce papier, nous nous intĂ©ressons Ă  la prise en compte de l'imperfection des tags en vue de leur utilisation pour l'amĂ©lioration de la performance des systĂšmes d'annotation. Nous proposons un systĂšme de classification multimodale qui prend en compte l'imperfection des tags. L'amĂ©lioration de ~8% de classification obtenue sur la base d'images VCDT (Visual Concept detection Task) de la campagne d'Ă©valuation ImageClef2011 montre l'intĂ©rĂȘt de cette modĂ©lisatio

    Un assistant de mémoire pour les trÚs petits projets d'ingénierie du logiciel

    No full text
    International audienceNous proposons d'assister la mémoire des trÚs petits projets d'ingénierie du logiciel avec une infrastructure la plus simple possible (un wiki sémantique) et des activités de gestion de connaissances intégrées dans deux processus issus de la norme ISO/IEC 29110, la gestion de projet (Project Management) et l'implémentation du logiciel (Software Implementation). L'enregistrement, la réutilisation, la recherche et le partage de connaissances sont facilités par l'emploi d'un noyau ontologique basé sur le modÚle de référence CIDOC CRM, enrichi par la modélisation du domaine de la norme 29110

    MAWA, dispositif de « navigation sociale »

    Get PDF
    Le systĂšme MAWA, objet de cette communication, s'inscrit dans la thĂ©matique des systĂšmes multi-agents pour les TIC. Ensemble d'agents rĂ©partis sur l'internet, ceux-ci coopĂšrent pour enrichir les connaissances relatives Ă  la navigation des utilisateurs. AprĂšs avoir replacĂ© le dispositif MAWA dans le contexte des outils relatifs au « web collaboratif », le texte retrace les suites d'une premiĂšre expĂ©rimentation du dispositif, dans le cadre d'une recherche commune entre chercheurs en informatique et en communication, dont les objectifs, par une approche plus qualitative des navigations recueillies, Ă©taient notamment de parfaire les algorithmes au cƓur du dispositif. Cette coopĂ©ration prĂ©cise notamment, dans un registre SIC, et conformĂ©ment aux spĂ©cificitĂ©s « pragmatiques » de l'outil, quelques pistes de dĂ©veloppement pour le dispositif

    " Quand rédiger c'est décrire " : Mise en forme matérielle des textes et construction d'ontologies à partir de textes

    Get PDF
    National audienceLa construction d'ontologie Ă  partir de textes met classiquement en oeuvre des outils issus du Traitement Automatique de la Langue et/ou des outils d'apprentissage supervisĂ© ou non. Dans cet article nous revenons sur la possibilitĂ© d'exploiter des objets textuels Ă  la fois facilement identifiables, souvent fertiles en connaissances ontologiques, et dont la sĂ©mantique peut clairement ĂȘtre explicitĂ©e par les thĂ©ories du discours : les structures Ă©numĂ©ratives. Ici, nous ajoutons une nouvelle classe de relations sĂ©mantiques portĂ©e par les structures Ă©numĂ©ratives trĂšs prĂ©sentes dans nos corpus : les relations lexicales telles que l'homonymie ou la synonymie. Ces relations semblent propices pour alimenter la facette terminologique d'une Ressource Termino-Ontologique. Nous montrons que ces relations peuvent ĂȘtre formellement caractĂ©risĂ©es. Une Ă©valuation de notre approche Ă  partir d'un corpus annotĂ© manuellement nous permet de valider notre position, ce qui constitue une premiĂšre Ă©tape vers un outil d'apprentissage supervisĂ© pour la construction d'ontologie Ă  partir de texte

    Enrichissement contrÎlé de bases de connaissances à partir de documents semi-structurés annotés

    Get PDF
    International audienceGrĂące au Linked Open Data, les sources RDF mises Ă  disposition sur le Web sont de plus en plus nombreuses. Cependant, ces sources contiennent relativement peu d'information par comparaison au volume d'informations contenues dans les documents semi-structurĂ©s. De nombreux outils ont pour objectif d'annoter sĂ©mantiquement ces documents mais l'extraction de relations reste une tĂąche particuliĂšrement difficile quand la structure et le vocabulaire des documents sont hĂ©tĂ©rogĂšnes. Nous proposons une approche permettant d'enrichir et d'interroger une ou plusieurs bases de connaissances RDF/OWL en exploitant un ensemble de documents sĂ©mantiquement annotĂ©s. Ces bases sont enrichies par des instances de relations incertaines infĂ©rĂ©es Ă  partir de la structure des documents, des ontologies et des faits prĂ©sents dans les bases de connaissances. Une requĂȘte SPARQL formulĂ©e dans le vocabulaire du domaine est reformulĂ©e afin de combiner les faits issus des diffĂ©rentes bases et de trier les rĂ©ponses en fonction de poids assignĂ©s. L'approche a Ă©tĂ© expĂ©rimentĂ©e sur des documents HTML et des bases de connaissances issues du Linked Open Data. Les rĂ©sultats montrent que 63,3% des relations trouvĂ©es sont nouvelles avec une prĂ©cision atteignant 62%
    • 

    corecore