158 research outputs found

    Donner du sens à des documents semi-structurés : de la construction d'ontologies à l'annotation sémantique

    Get PDF
    Chapitre 05 : Donner du sens Ă  des documents semi-structurĂ©s : de la construction d'ontologies Ă  l'annotation sĂ©mantiqueNational audiencePartie 1 : construction et peuplement d'ontologies à partir de textes : démarche générale - critères de bonne structuration d'une ontologie - outils de Traitement Automatique des Langues pour faciliter la construction d'ontologies - ouvertures Partie 2 : "donner du sens" à des contenus : l'annotation sémantique : associer des données et des modèles sémantiques - démarche générale - quel type de ressource pour caractériser "sémantiquement" des contenus/ des données ? - où l'on retrouve le TAL / ouverture

    Production ascendante d'ontologies légÚres sur le web sémantique : une application au référencement de sections de cours

    Get PDF
    RÉSUMÉ Plusieurs initiatives de mĂ©tadonnĂ©es ont Ă©tĂ© proposĂ©es pour amĂ©liorer le repĂ©rage des contenus sur le Web. MalgrĂ© leur niveau de sophistication Ă©levĂ©, aucune des initiatives de mĂ©tadonnĂ©es ne rĂ©ussit Ă  s'adapter complĂštement au caractĂšre atomique des objets d'apprentissage. La nature complexe des objets d'apprentissage demande, en effet, l'utilisation de structures de mĂ©tadonnĂ©es flexibles pouvant ĂȘtre dĂ©finies sur mesure pour rĂ©pondre au contexte particulier de chaque objet. La dĂ©finition d'une structure de mĂ©tadonnĂ©es commune exige toutefois un effort de coordination important entre diffĂ©rents acteurs pour dĂ©finir, maintenir et mettre Ă  jour les Ă©lĂ©ments de descriptions. Le consensus nĂ©cessaire entre ces intervenants rend lui-mĂȘme encore plus difficile la personnalisation des Ă©lĂ©ments de descriptions. Il est toutefois possible de rĂ©aliser une description fine des objets d'apprentissage en insĂ©rant directement des annotations Ă  l'intĂ©rieur des contenus Web. Une annotation est une note, une explication, ou tout autre type de remarque externe pouvant ĂȘtre attachĂ©e Ă  un document sans toutefois ĂȘtre nĂ©cessairement insĂ©rĂ©e dans ce document. Il est aussi possible de prĂ©ciser la sĂ©mantique d'une annotation en utilisant des descriptions RDF (Resource Description Framework). Le RDF est une recommandation du W3C pour la description des ressources Web. Il s'agit d'un modĂšle de donnĂ©es pour la description de ressources qui peut donc ĂȘtre considĂ©rĂ©, Ă  ce titre, comme un modĂšle de mĂ©tadonnĂ©es (ou mĂ©ta-mĂ©tadonnĂ©e). Les expressions RDF se prĂ©sentent comme des triplets composĂ©s d'un sujet, d'un prĂ©dicat et d'un objet de relation. Les Ă©lĂ©ments de triplets RDF servent Ă  indiquer qu'une ressource possĂšde une propriĂ©tĂ© et une valeur donnĂ©e. Une expression RDF peut faire rĂ©fĂ©rence Ă  des ontologies pour prĂ©ciser le sens d'une ressource Web. Une ontologie dĂ©finit d'une maniĂšre formelle les connaissances communes d'un domaine particulier partagĂ©es entre diffĂ©rents utilisateurs. Les ontologies jouent ainsi le rĂŽle d'une langue universelle, une sorte d'interlingua, qui permet Ă  des gens ou des applications d'Ă©changer des informations sur une base commune. Ces informations concernent aussi bien les concepts que les rapports qui existent entre les diffĂ©rents Ă©lĂ©ments de connaissance d'un domaine La conception d'ontologies reste une opĂ©ration complexe qui demande un travail de rĂ©flexion important. Des ontologies rĂ©alisĂ©es de maniĂšre isolĂ©e par des individus diffĂ©rents peuvent ainsi donner naissance Ă  des descriptions trĂšs diffĂ©rentes d'un mĂȘme domaine. Une solution pour rĂ©duire l'hĂ©tĂ©rogĂ©nĂ©itĂ© structurale et sĂ©mantique des ontologies consiste Ă  mettre en place des Ă©quipes de travail qui rĂ©alisent ensemble la sĂ©lection et la dĂ©finition des Ă©lĂ©ments d'une ontologie commune. Le recours Ă  ces Ă©quipes spĂ©cialisĂ©es implique toutefois les mĂȘmes inconvĂ©nients que ceux rencontrĂ©s dans la construction des descriptions proposĂ©es par les grandes initiatives de mĂ©tadonnĂ©es. Nous pensons qu'il est toutefois possible de rĂ©aliser des ontologies consensuelles sans nĂ©cessairement impliquer une Ă©quipe de conception spĂ©cialisĂ©e. Sur la base de notre propre expĂ©rience, nous avons constatĂ© que lorsqu'un concepteur de cours rĂ©cupĂšre un contenu dĂ©jĂ  annotĂ©, celui-ci se montre aussi gĂ©nĂ©ralement intĂ©ressĂ© Ă  conserver la valeur des annotations rĂ©cupĂ©rĂ©es. Ces mĂȘmes annotations sont aussi souvent rĂ©utilisĂ©es de nouveau pour rĂ©aliser des descriptions supplĂ©mentaires. Nous pensons donc qu'il est ainsi possible de favoriser la construction d'ontologies en permettant simplement Ă  des concepteurs de cours d'Ă©changer librement des contenus annotĂ©s entre eux tout en permettant Ă  chacun de rajouter/retrancher les descriptions sĂ©mantiques rattachĂ©es aux annotations rĂ©cupĂ©rĂ©es. Nous croyons que les Ă©lĂ©ments d'ontologies rĂ©cupĂ©rĂ©s par chacun seront ainsi systĂ©matiquement rĂ©utilisĂ©s pour favoriser la construction d'ontologies de plus en plus importantes. Nous faisons ainsi l'hypothĂšse que les emprunts d'annotations rĂ©alisĂ©s successivement par diffĂ©rents concepteurs de cours se traduisent toujours par un bilan positif entre les ajouts et les retraits rĂ©alisĂ©s par chacun d'eux, rĂ©alisant ainsi un effet de levier positif sur la production globale des annotations. Autrement dit, nous croyons que le nombre de descriptions augmente au fur et Ă  mesure de l'implication d'un nouvel intervenant dans une chaĂźne de partage. Pour vĂ©rifier cette hypothĂšse, nous avons rĂ©alisĂ© une expĂ©rience avec huit sujets pour vĂ©rifier le taux de rĂ©utilisation des annotations et le taux de rĂ©utilisation des classes d'ontologie associĂ©es Ă  ces mĂȘmes annotations au travers des Ă©changes successifs de contenus entre concepteurs de cours. Nous avons construit un prototype logiciel qui permet la construction et l'Ă©change d'annotations RDF associĂ©es Ă  des ontologies OWL (Web Ontology Language). Les huit sujets avaient pour consigne d'Ă©changer entre eux des contenus de cours et de modifier, si nĂ©cessaire, les annotations dĂ©jĂ  rĂ©alisĂ©es par les autres. Les actions des diffĂ©rents utilisateurs Ă©taient enregistrĂ©es par le logiciel. En Ă©tudiant le fichier de journalisation gĂ©nĂ©rĂ© par le logiciel, nous avons dĂ©montrĂ© que le taux de rĂ©utilisation des annotations est de 88% alors que celui des classes d'ontologies Ă©changĂ©es atteint 99%. Nous avons ainsi dĂ©couvert l'existence d'un effet de levier important dans la conception de contenus annotĂ©s qui facilitera certainement la mise en place dĂ©finitive du Web sĂ©mantique. Les gains de cette dĂ©couverte sont nombreux : notamment de ne plus ĂȘtre dĂ©pendant d'Ă©quipes spĂ©cialisĂ©es pour la production d'ontologies consensuelles, de rĂ©duire substantiellement la nĂ©cessitĂ© d'avoir Ă  recourir Ă  des techniques complexes d'alignement d'ontologies et de favoriser la capture des connaissances directement au niveau des concepteurs de contenu. CONTENU Les initiatives de mĂ©tadonnĂ©es -- Initiatives de collaboration -- MĂ©tadonnĂ©es pĂ©dagogiques -- ProblĂšmes de la personnalisation des structures de mĂ©tadonnĂ©es -- Les annotations -- Annotations Ă©lectroniques -- CatĂ©gorisation -- Les ontologies -- Le Web sĂ©mantique -- Resource description framework (RDF) -- OWL -- Architecture -- ProblĂšme de description des contenus -- Structure de description des mĂ©tadonnĂ©es -- Annotations manuelles -- HĂ©tĂ©rogĂ©nĂ©itĂ© des descriptions RDF -- Alignement des ontologies -- Acteurs -- MĂ©thodologie Prototype logiciel -- Analyse des rĂ©sultats -- DurĂ©e -- RĂ©utilisation des annotations -- Ontologies produites -- RĂ©utilisation des ontologies -- Annogramme -- FacilitĂ© d'utilisation -- Comportement et attitude -- Contribution Ă  l'avancement des connaissances

    Modélisation du domaine par une méthode fondée sur l'analyse de corpus (2000)

    Get PDF
    12 pagesNational audienceLes nombreux travaux actuels sur les ontologies et modÚles de domaines, justifiés par la perspective de leur réutilisabilité, proposent trÚs peu de solutions aux problÚmes pratiques de recueil et de structuration de ces connaissances. Cet article propose une méthode de construction de modÚles de domaine ou d'ontologies, dont l'originalité est de se fonder sur l'analyse de corpus en utilisant ses principes linguistiques et ses logiciels de traitement automatique de la langue. Cette démarche se veut un complément efficace et précis aux méthodes classiques de modélisation du domaine à partir d'expertises individuelles

    Correction d'ontologies construites Ă  partir de la structure de documents

    Get PDF
    National audienceLes logiciels de construction d'ontologies Ă  partir de textes rĂ©alisent une interprĂ©tation fixĂ©e a priori du contenu des textes, qu'un expert du domaine ou une ontologie doit vĂ©rifier. Or une Ă©tude prĂ©cise des limites des techniques d'analyse des textes permet de guider la correction de l'ontologie apprise en dĂ©finissant des rĂšgles d'aide Ă  la correction. Ces rĂšgles attirent l'attention de l'ontographe sur des parties d'ontologie contenant des « anomalies » et tiennent compte du texte d'origine et de l'analyse rĂ©alisĂ©e pour proposer des corrections. Dans cet article, nous illustrons la notion de rĂšgle de correction dans le cas oĂč les connaissances apprises viennent de l'exploitation de structures Ă©numĂ©ratives parallĂšles prĂ©sentes en corpus

    Intégration du web sémantique dans un systÚme d'aide à la décision pour le génie logiciel

    Get PDF
    Avoir Ă  sa disposition des donnĂ©es et des connaissances et savoir Ă  quoi elles servent c'est bien, savoir s'en servir c'est encore mieux. La qualitĂ© est un critĂšre recherchĂ© dans tous les domaines. Dans des domaines qui font allusion aux objets matĂ©riels, il est facile de dĂ©finir, d'observer et de savoir comment obtenir un produit fini de bonne qualitĂ©. Dans le domaine du gĂ©nie logiciel, il est bien plus difficile de dĂ©finir et d'observer la qualitĂ© d'un produit. On fait appel aux mĂ©triques, aux normes de qualitĂ©, aux modĂšles de qualitĂ©, etc., pour pouvoir dĂ©terminer, Ă©valuer et amĂ©liorer la qualitĂ© d'un logiciel. Les rĂ©sultats des Ă©tudes empiriques et les connaissances des experts Ă  ce sujet ne sont malheureusement pas partagĂ©s avec tous les acteurs du domaine, ce qui entraine des interprĂ©tations diffĂ©rentes, la rĂ©pĂ©tition des Ă©tudes ou l'ignorance de certains faits importants pour produire un logiciel de qualitĂ©. Dans le souci de permettre et faciliter le partage des connaissances et des donnĂ©es sur la qualitĂ© logicielle, nous avons exploitĂ© ce que le web sĂ©mantique offre (RDF, RDFS, OWL-DL). Nous avons aussi tirĂ© avantage du web sĂ©mantique pour encourager la communautĂ© du gĂ©nie logiciel Ă  unir leur savoir afin d'avoir la mĂȘme comprĂ©hension et interprĂ©tation des donnĂ©es et connaissances sur la qualitĂ© logicielle. Nous avons rĂ©alisĂ© une ontologie qui regroupe ces connaissances et donnĂ©es (modĂšles de qualitĂ©, attributs de qualitĂ©, mĂ©triques, etc.) indĂ©pendamment de leurs formats de sauvegarde. Nous avons mis cette ontologie Ă  la disposition de tous et tout acteur avec le droit d'Ă©criture peut apporter sa contribution Ă  cet effort de centralisation, d'uniformisation et partage des connaissances. En faisant partie intĂ©grante d'un systĂšme d'aide Ă  la dĂ©cision, cette ontologie est destinĂ©e Ă  contribuer, dans les phases de conception, d'implĂ©mentation et de maintenance.\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : modĂšles de qualitĂ©, mĂ©triques, web sĂ©mantique, ontologie

    Contribution Ă  la maintenance des ontologies Ă  partir d'analyses textuelles : extraction de termes et de relations entre termes

    Get PDF
    Les ontologies sont des nouvelles formes de contrĂŽle intelligent de l'information. Elles prĂ©sentent un savoir prĂ©alable requis pour un traitement systĂ©matique de l'information Ă  des fins de navigation, de rappel, de prĂ©cision, etc. Toutefois, les ontologies sont confrontĂ©es de façon continue Ă  un problĂšme d'Ă©volution. Étant donnĂ© la complexitĂ© des changements Ă  apporter, un processus de maintenance, du moins semi-automatique, s'impose de plus en plus pour faciliter cette tĂąche et assurer sa fiabilitĂ©.\ud L'approche proposĂ©e trouve son fondement dans un modĂšle cognitif dĂ©crivant un processus d'extraction de connaissances Ă  partir de textes et de thĂ©saurus. Nous mettons ainsi, les textes au centre du processus d'ingĂ©nierie des connaissances et prĂ©sentons une approche se dĂ©marquant des techniques formelles classiques en reprĂ©sentation de connaissances par son indĂ©pendance de la langue. Les traitements textuels sont fondĂ©s principalement sur un processus de classification supportĂ© par un rĂ©seau de neurones (ART 1) et sur l'Indexation SĂ©mantique Latente appliquĂ©e sur des classes de termes. Partant de l'hypothĂšse que l'extraction -de connaissances Ă  partir de textes ne peut se contenter d'un traitement statistique (ni mĂȘme linguistique) de donnĂ©es textuelles pour accaparer toute leur richesse sĂ©mantique, un processus d'extraction de connaissances Ă  partir d'un thĂ©saurus a Ă©tĂ© conçu afin d'intĂ©grer, le mieux possible, les connaissances du domaine au sein de l'ontologie. Ce processus est fondĂ© principalement sur un calcul d'associations sĂ©mantiques entre des Vecteurs Conceptuels. Le modĂšle proposĂ© reprĂ©sente une chaĂźne de traitement (ONTOLOGICO) au sein de la plateforme\ud SATIM. Ce modĂšle vise Ă  assister les experts de domaine dans leur tĂąche de conceptualisation et de maintenance des ontologies en se basant sur un processus itĂ©ratif supportĂ© par un ensemble de modules, en particulier, un extracteur de termes, un lemmatiseur, un segmenteur, un classifieur, un module de raffinement sĂ©mantique basĂ© sur l'Indexation SĂ©mantique Latente et un identificateur de termes reliĂ©s basĂ© sur le calcul de similaritĂ© sĂ©mantique entre les couples de vecteurs conceptuels. La dĂ©couverte de relations entre termes pour les besoins d'une conceptualisation de domaine s'avĂšre ĂȘtre le rĂ©sultat d'une complĂ©mentaritĂ© de traitements appliquĂ©s tant sur des textes de domaine que sur un thĂ©saurus. D'une part, les analyses textuelles fondĂ©es principalement sur l'application de l'Indexation SĂ©mantique Latente sur des classes de termes gĂ©nĂšrent des relations sĂ©mantiques prĂ©cises. D'autre part, l'extraction de relations sĂ©mantiques Ă  partir d'un thĂ©saurus, en se basant sur une reprĂ©sentation par des Vecteurs conceptuels, constitue un choix thĂ©orique judicieux et performant. Ce processus joue en effet, un rĂŽle important dans la complĂ©tude des relations.\ud Ce projet de recherche se place au coeur des Ă©changes entre terminologie et acquisition de connaissances. Il amĂšne une rĂ©flexion sur les divers paliers Ă  envisager dans une telle dĂ©marche de modĂ©lisation de connaissances textuelles pour des objectifs de maintenance d'une ontologie de domaine. La mĂ©thodologie proposĂ©e constitue une aide prĂ©cieuse dans le domaine de la maintenance des ontologies. Elle assiste les terminologues chargĂ©s de naviguer Ă  travers de vastes donnĂ©es textuelles pour extraire et normaliser la terminologie et facilite la tĂąche des ingĂ©nieurs en connaissances, chargĂ©s de modĂ©liser des domaines. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Maintenance d'ontologie, Traitement Automatique du Langage Naturel (TALN), Indexation SĂ©mantique Latente, Vecteurs Conceptuels, Classification automatique, RĂ©seaux de Neurones

    Recherche d'information sémantique et extraction automatique d'ontologie du domaine

    Get PDF
    Il peut s'avĂ©rer ardu, mĂȘme pour une organisation de petite taille, de se retrouver parmi des centaines, voir des milliers de documents Ă©lectroniques. Souvent, les techniques employĂ©es par les moteurs de recherche dans Internet sont utilisĂ©es par les entreprises voulant faciliter la recherche d'information dans leur intranet. Ces techniques reposent sur des mĂ©thodes statistiques et ne permettent pas de traiter la sĂ©mantique contenue dans la requĂȘte de l'usager ainsi que dans les documents. Certaines approches ont Ă©tĂ© dĂ©veloppĂ©es pour extraire cette sĂ©mantique et ainsi, mieux rĂ©pondre Ă  des requĂȘtes faites par les usagers. Par contre, la plupart de ces techniques ont Ă©tĂ© conçues pour s'appliquer au Web en entier et non pas sur un domaine en particulier. Il pourrait ĂȘtre intĂ©ressant d'utiliser une ontologie pour reprĂ©senter un domaine spĂ©cifique et ainsi, ĂȘtre capable de mieux rĂ©pondre aux questions posĂ©es par un usager. Ce mĂ©moire prĂ©sente notre approche proposant l'utilisation du logiciel Text- To-Onto pour crĂ©er automatiquement une ontologie dĂ©crivant un domaine. Cette mĂȘme ontologie est par la suite utilisĂ©e par le logiciel Sesei, qui est un filtre sĂ©mantique pour les moteurs de recherche conventionnels. Cette mĂ©thode permet ainsi d'amĂ©liorer la pertinence des documents envoyĂ©s Ă  l'usager.It can prove to be diffcult, even for a small size organization, to find information among hundreds, even thousands of electronic documents. Most often, the methods employed by search engines on the Internet are used by companies wanting to improve information retrieval on their intranet. These techniques rest on statistical methods and do not make it possible neither to evaluate the semantics contained in the user requests, nor in the documents. Certain methods were developed to extract this semantics and thus, to improve the answer given to requests. On the other hand, the majority of these techniques were conceived to be applied on the entire World Wide Web and not on a particular field of knowledge, like corporative data. It could be interesting to use domain specific ontologies in trying to link a specific query to related documents and thus, to be able to better answer these queries. This thesis presents our approach which proposes the use of the Text-To-Onto software to automatically create an ontology describing a particular field. Thereafter, this ontology is used by the Sesei software, which is a semantic filter for conventional search engines. This method makes it possible to improve the relevance of documents returned to the user

    Un environnement sémantique à base d'agents pour la formation à distance (E-Learning)

    Get PDF
    Aujourd’hui, les Ă©tablissements d’enseignement, tels que les universitĂ©s, de plus en plus offrent des contenus d’E -Learning. Certains de ces cours sont utilisĂ©s avec l'enseignement traditionnel (face Ă  face ou prĂ©sentiel), tandis que d'autres sont utilisĂ©s entiĂšrement en ligne. La crĂ©ation de contenu d'apprentissage est une tĂąche principale dans tous les environnements d'apprentissage en ligne. Les contraintes de rĂ©duire au minimum le temps nĂ©cessaire pour dĂ©velopper un contenu d'apprentissage, d'augmenter sa qualitĂ© scientifique et de l'adapter Ă  de nombreuses situations (contenu adaptatif), ont Ă©tĂ© un principal objectif et donc plusieurs approches et mĂ©thodes ont Ă©tĂ© proposĂ©es. En outre, les caractĂ©ristiques intellectuelles et sociales, ainsi que les styles d'apprentissage des individus, peuvent ĂȘtre trĂšs diffĂ©rents. Ces diffĂ©rences conduisent les personnes Ă  adapter le contenu d'apprentissage en tenant compte des profils des apprenants et de leurs objectifs et caractĂ©ristiques. Cette recherche ouvre des portes pour les systĂšmes d'apprentissage avancĂ©es, qui fournissent aux apprenants immĂ©diatement, des contenus d’apprentissage adaptĂ©s selon plusieurs critĂšres de chaque apprenant. Alors que, il ne peut pas ĂȘtre pratique si nous n'avons pas plus d'informations sur l'apprenant et le contenu d'apprentissage (objectifs d'apprentissage, les prĂ©requis, prĂ©fĂ©rences, niveaux ...etc). Par consĂ©quent, nous dĂ©veloppons un systĂšme collaboratif, oĂč plusieurs auteurs travaillent en collaboration, pour crĂ©er et annoter le contenu Ă©ducatif en utilisant le systĂšme multi-agents. La contribution de notre systĂšme est l'hybridation des techniques d'adaptation avec celles de la collaboration et du Web sĂ©mantique (ontologie, annotation). Nous reprĂ©sentons les profils des apprenants et le contenu d'apprentissage en utilisant des ontologies et des annotations pour rĂ©pondre Ă  la diversitĂ© et aux besoins individuelles des apprenants. Nous utilisons le paradigme agent, dans notre systĂšme, pour bĂ©nĂ©ficier des points forts de ce paradigme tels que la modularitĂ©, autonomie, flexibilitĂ©... etc

    L'assemblage de systÚmes d'informations économique et logistique pour supporter la négociation dans la filiÚre canne - Une expérience sémantique

    Get PDF
    14 p.To address the supply and the payment jointly in different socio-economic contexts, the sugarcane industry wants to gather two existing information systems. MAGI Âź and MODECO being from different disciplinary background, they experience a different way the functioning of the sugar industry. The question that arises is that of the impact of this difference on merging databases. The purpose of this paper is to relate the experience of building the software platform PEMPAÂź and in particular deal with database merging using the ontology's alignment
    • 

    corecore