1,342 research outputs found
Annotation sémantique de pages web
National audienceCet article prĂ©sente un systĂšme automatique d'annotation sĂ©mantique de pages web. Les systĂšmes d'annotation automatique existants sont essentiellement syntaxiques, mĂȘme lorsque les travaux visent Ă produire une annotation sĂ©mantique. La prise en compte d'informations sĂ©mantiques sur le domaine pour l'annotation d'un Ă©lĂ©ment dans une page web Ă partir d'une ontologie suppose d'aborder conjointement deux problĂšmes : (1) l'identification de la structure syntaxique caractĂ©risant cet Ă©lĂ©ment dans la page web et (2) l'identification du concept le plus spĂ©cifique (en termes de subsumption) dans l'ontologie dont l'instance sera utilisĂ©e pour annoter cet Ă©lĂ©ment. Notre dĂ©marche repose sur la mise en oeuvre d'une technique d'apprentissage issue initialement des wrappers que nous avons articulĂ©e avec des raisonnements exploitant la structure formelle de l'ontologie
Construction d'ontologies à partir d'une collection de pages web structurées
MoanoDe nombreuses collections de documents disponibles sur le web dĂ©crivent les caractĂ©ristiques d'entitĂ©s d'un mĂȘme type (e.g. des produits, des plantes), chaque page prĂ©sentant une de ces entitĂ©s. Ces documents sont des sources de connaissances particuliĂšrement adaptĂ©es pour la construction d'ontologies. Alors qu'ils partagent une mĂȘme mise en forme rĂ©guliĂšre, ils contiennent moins de texte rĂ©digĂ© que des fichiers textes mais leur architecture est riche de sens. De ce fait, les mĂ©thodes linguistiques classiques pour identifier des concepts et des relations sont moins adaptĂ©es pour les analyser. Nous proposons une approche exploitant les diverses propriĂ©tĂ©s de ces documents, combinant analyse de la structure et de la mise en forme avec une analyse linguistique, et exploitant leur annotation sĂ©mantique
Semantic Annotation of Documents: A Comparative Study
Semantic annotation, which is considered one of the semantic web applicative aspects, has been adopted by researchers from different communities as a paramount solution that improves searching and retrieval of information by promoting the richness of the content. However, researchers are facing challenges concerning both the quality and the relevance of the semantic annotations attached to the annotated document against its content as well as its semantics, without ignoring those regarding automation process which is supposed to ensure an optimal system for information indexing and retrieval. In this article, we will introduce the semantic annotation concept by presenting a state of the art including definitions, features and a classification of annotation systems. Systems and proposed approaches in the field will be cited, as well as a study of some existing annotation tools. This study will also pinpoint various problems and limitations related to the annotation in order to offer solutions for our future work
Donner du sens à des documents semi-structurés : de la construction d'ontologies à l'annotation sémantique
Chapitre 05 : Donner du sens Ă des documents semi-structurĂ©s : de la construction d'ontologies Ă l'annotation sĂ©mantiqueNational audiencePartie 1 : construction et peuplement d'ontologies aÌ partir de textes : deÌmarche geÌneÌrale - criteÌres de bonne structuration d'une ontologie - outils de Traitement Automatique des Langues pour faciliter la construction d'ontologies - ouvertures Partie 2 : "donner du sens" aÌ des contenus : l'annotation seÌmantique : associer des donneÌes et des modeÌles seÌmantiques - deÌmarche geÌneÌrale - quel type de ressource pour caracteÌriser "seÌmantiquement" des contenus/ des donneÌes ? - ouÌ l'on retrouve le TAL / ouverture
Une nouvelle méthode de Web Usage Mining basée sur une analyse sémiotique du comportement de navigation
International audienceLâobjectif de nos travaux est de proposer une mĂ©thode dâanalyse automatique du comportement des utilisateurs Ă des fins de prĂ©diction de leur propension Ă rĂ©aliser une action suggĂ©rĂ©e. Nous proposons dans cet article une nouvelle mĂ©thode de Web Usage Mining basĂ©e sur une Ă©tude sĂ©miotique des styles perceptifs, considĂ©rant lâexpĂ©rience de lâutilisateur comme Ă©lĂ©ment dĂ©terminant de sa rĂ©action Ă une sollicitation. LâĂ©tude de ces styles nous a amenĂ© Ă dĂ©finir de nouveaux indicateurs (des descripteurs sĂ©miotiques) introduisant un niveau supplĂ©mentaire Ă lâapproche sĂ©mantique dâannotation des sites. Nous proposons ensuite un modĂšle neuronal adaptĂ© au traitement de ces nouveaux indicateurs. Nous expliquerons en quoi le modĂšle proposĂ© est le plus pertinent pour traiter ces informations
Prise en compte de l'imperfection des tags pour la classification sémantique d'images
Session "Articles"National audienceL'annotation d'images consiste Ă dĂ©crire le contenu des images en utilisant un nombre fini de concepts fixĂ©s a priori. En pratique, nous utilisons deux modalitĂ©s pour cela : l'image et les tags utilisateurs qui les accompagnent. Cependant, ces tags sont en gĂ©nĂ©ral imparfaits et seulement une partie est pertinente vis-Ă -vis du contenu de l'image. Dans ce papier, nous nous intĂ©ressons Ă la prise en compte de l'imperfection des tags en vue de leur utilisation pour l'amĂ©lioration de la performance des systĂšmes d'annotation. Nous proposons un systĂšme de classification multimodale qui prend en compte l'imperfection des tags. L'amĂ©lioration de ~8% de classification obtenue sur la base d'images VCDT (Visual Concept detection Task) de la campagne d'Ă©valuation ImageClef2011 montre l'intĂ©rĂȘt de cette modĂ©lisatio
Un assistant de mémoire pour les trÚs petits projets d'ingénierie du logiciel
International audienceNous proposons d'assister la mémoire des trÚs petits projets d'ingénierie du logiciel avec une infrastructure la plus simple possible (un wiki sémantique) et des activités de gestion de connaissances intégrées dans deux processus issus de la norme ISO/IEC 29110, la gestion de projet (Project Management) et l'implémentation du logiciel (Software Implementation). L'enregistrement, la réutilisation, la recherche et le partage de connaissances sont facilités par l'emploi d'un noyau ontologique basé sur le modÚle de référence CIDOC CRM, enrichi par la modélisation du domaine de la norme 29110
MAWA, dispositif de « navigation sociale »
Le systĂšme MAWA, objet de cette communication, s'inscrit dans la thĂ©matique des systĂšmes multi-agents pour les TIC. Ensemble d'agents rĂ©partis sur l'internet, ceux-ci coopĂšrent pour enrichir les connaissances relatives Ă la navigation des utilisateurs. AprĂšs avoir replacĂ© le dispositif MAWA dans le contexte des outils relatifs au « web collaboratif », le texte retrace les suites d'une premiĂšre expĂ©rimentation du dispositif, dans le cadre d'une recherche commune entre chercheurs en informatique et en communication, dont les objectifs, par une approche plus qualitative des navigations recueillies, Ă©taient notamment de parfaire les algorithmes au cĆur du dispositif. Cette coopĂ©ration prĂ©cise notamment, dans un registre SIC, et conformĂ©ment aux spĂ©cificitĂ©s « pragmatiques » de l'outil, quelques pistes de dĂ©veloppement pour le dispositif
" Quand rédiger c'est décrire " : Mise en forme matérielle des textes et construction d'ontologies à partir de textes
National audienceLa construction d'ontologie Ă partir de textes met classiquement en oeuvre des outils issus du Traitement Automatique de la Langue et/ou des outils d'apprentissage supervisĂ© ou non. Dans cet article nous revenons sur la possibilitĂ© d'exploiter des objets textuels Ă la fois facilement identifiables, souvent fertiles en connaissances ontologiques, et dont la sĂ©mantique peut clairement ĂȘtre explicitĂ©e par les thĂ©ories du discours : les structures Ă©numĂ©ratives. Ici, nous ajoutons une nouvelle classe de relations sĂ©mantiques portĂ©e par les structures Ă©numĂ©ratives trĂšs prĂ©sentes dans nos corpus : les relations lexicales telles que l'homonymie ou la synonymie. Ces relations semblent propices pour alimenter la facette terminologique d'une Ressource Termino-Ontologique. Nous montrons que ces relations peuvent ĂȘtre formellement caractĂ©risĂ©es. Une Ă©valuation de notre approche Ă partir d'un corpus annotĂ© manuellement nous permet de valider notre position, ce qui constitue une premiĂšre Ă©tape vers un outil d'apprentissage supervisĂ© pour la construction d'ontologie Ă partir de texte
Enrichissement contrÎlé de bases de connaissances à partir de documents semi-structurés annotés
International audienceGrĂące au Linked Open Data, les sources RDF mises Ă disposition sur le Web sont de plus en plus nombreuses. Cependant, ces sources contiennent relativement peu d'information par comparaison au volume d'informations contenues dans les documents semi-structurĂ©s. De nombreux outils ont pour objectif d'annoter sĂ©mantiquement ces documents mais l'extraction de relations reste une tĂąche particuliĂšrement difficile quand la structure et le vocabulaire des documents sont hĂ©tĂ©rogĂšnes. Nous proposons une approche permettant d'enrichir et d'interroger une ou plusieurs bases de connaissances RDF/OWL en exploitant un ensemble de documents sĂ©mantiquement annotĂ©s. Ces bases sont enrichies par des instances de relations incertaines infĂ©rĂ©es Ă partir de la structure des documents, des ontologies et des faits prĂ©sents dans les bases de connaissances. Une requĂȘte SPARQL formulĂ©e dans le vocabulaire du domaine est reformulĂ©e afin de combiner les faits issus des diffĂ©rentes bases et de trier les rĂ©ponses en fonction de poids assignĂ©s. L'approche a Ă©tĂ© expĂ©rimentĂ©e sur des documents HTML et des bases de connaissances issues du Linked Open Data. Les rĂ©sultats montrent que 63,3% des relations trouvĂ©es sont nouvelles avec une prĂ©cision atteignant 62%
- âŠ