403 research outputs found

    Le Web sémantique n'est pas antisocial

    Get PDF
    National audienceCet article rebondit sur une série d'articles soulignant l'importance de la prise en compte de l'aspect social dans le Web sémantique mais opposant radicalement l'approche Web sémantique et l'approche sociale. Tout en reconnaissant cette importance, nous montrons ici que ces deux approches sont complémentaires

    Production ascendante d'ontologies légères sur le web sémantique : une application au référencement de sections de cours

    Get PDF
    RÉSUMÉ Plusieurs initiatives de métadonnées ont été proposées pour améliorer le repérage des contenus sur le Web. Malgré leur niveau de sophistication élevé, aucune des initiatives de métadonnées ne réussit à s'adapter complètement au caractère atomique des objets d'apprentissage. La nature complexe des objets d'apprentissage demande, en effet, l'utilisation de structures de métadonnées flexibles pouvant être définies sur mesure pour répondre au contexte particulier de chaque objet. La définition d'une structure de métadonnées commune exige toutefois un effort de coordination important entre différents acteurs pour définir, maintenir et mettre à jour les éléments de descriptions. Le consensus nécessaire entre ces intervenants rend lui-même encore plus difficile la personnalisation des éléments de descriptions. Il est toutefois possible de réaliser une description fine des objets d'apprentissage en insérant directement des annotations à l'intérieur des contenus Web. Une annotation est une note, une explication, ou tout autre type de remarque externe pouvant être attachée à un document sans toutefois être nécessairement insérée dans ce document. Il est aussi possible de préciser la sémantique d'une annotation en utilisant des descriptions RDF (Resource Description Framework). Le RDF est une recommandation du W3C pour la description des ressources Web. Il s'agit d'un modèle de données pour la description de ressources qui peut donc être considéré, à ce titre, comme un modèle de métadonnées (ou méta-métadonnée). Les expressions RDF se présentent comme des triplets composés d'un sujet, d'un prédicat et d'un objet de relation. Les éléments de triplets RDF servent à indiquer qu'une ressource possède une propriété et une valeur donnée. Une expression RDF peut faire référence à des ontologies pour préciser le sens d'une ressource Web. Une ontologie définit d'une manière formelle les connaissances communes d'un domaine particulier partagées entre différents utilisateurs. Les ontologies jouent ainsi le rôle d'une langue universelle, une sorte d'interlingua, qui permet à des gens ou des applications d'échanger des informations sur une base commune. Ces informations concernent aussi bien les concepts que les rapports qui existent entre les différents éléments de connaissance d'un domaine La conception d'ontologies reste une opération complexe qui demande un travail de réflexion important. Des ontologies réalisées de manière isolée par des individus différents peuvent ainsi donner naissance à des descriptions très différentes d'un même domaine. Une solution pour réduire l'hétérogénéité structurale et sémantique des ontologies consiste à mettre en place des équipes de travail qui réalisent ensemble la sélection et la définition des éléments d'une ontologie commune. Le recours à ces équipes spécialisées implique toutefois les mêmes inconvénients que ceux rencontrés dans la construction des descriptions proposées par les grandes initiatives de métadonnées. Nous pensons qu'il est toutefois possible de réaliser des ontologies consensuelles sans nécessairement impliquer une équipe de conception spécialisée. Sur la base de notre propre expérience, nous avons constaté que lorsqu'un concepteur de cours récupère un contenu déjà annoté, celui-ci se montre aussi généralement intéressé à conserver la valeur des annotations récupérées. Ces mêmes annotations sont aussi souvent réutilisées de nouveau pour réaliser des descriptions supplémentaires. Nous pensons donc qu'il est ainsi possible de favoriser la construction d'ontologies en permettant simplement à des concepteurs de cours d'échanger librement des contenus annotés entre eux tout en permettant à chacun de rajouter/retrancher les descriptions sémantiques rattachées aux annotations récupérées. Nous croyons que les éléments d'ontologies récupérés par chacun seront ainsi systématiquement réutilisés pour favoriser la construction d'ontologies de plus en plus importantes. Nous faisons ainsi l'hypothèse que les emprunts d'annotations réalisés successivement par différents concepteurs de cours se traduisent toujours par un bilan positif entre les ajouts et les retraits réalisés par chacun d'eux, réalisant ainsi un effet de levier positif sur la production globale des annotations. Autrement dit, nous croyons que le nombre de descriptions augmente au fur et à mesure de l'implication d'un nouvel intervenant dans une chaîne de partage. Pour vérifier cette hypothèse, nous avons réalisé une expérience avec huit sujets pour vérifier le taux de réutilisation des annotations et le taux de réutilisation des classes d'ontologie associées à ces mêmes annotations au travers des échanges successifs de contenus entre concepteurs de cours. Nous avons construit un prototype logiciel qui permet la construction et l'échange d'annotations RDF associées à des ontologies OWL (Web Ontology Language). Les huit sujets avaient pour consigne d'échanger entre eux des contenus de cours et de modifier, si nécessaire, les annotations déjà réalisées par les autres. Les actions des différents utilisateurs étaient enregistrées par le logiciel. En étudiant le fichier de journalisation généré par le logiciel, nous avons démontré que le taux de réutilisation des annotations est de 88% alors que celui des classes d'ontologies échangées atteint 99%. Nous avons ainsi découvert l'existence d'un effet de levier important dans la conception de contenus annotés qui facilitera certainement la mise en place définitive du Web sémantique. Les gains de cette découverte sont nombreux : notamment de ne plus être dépendant d'équipes spécialisées pour la production d'ontologies consensuelles, de réduire substantiellement la nécessité d'avoir à recourir à des techniques complexes d'alignement d'ontologies et de favoriser la capture des connaissances directement au niveau des concepteurs de contenu. CONTENU Les initiatives de métadonnées -- Initiatives de collaboration -- Métadonnées pédagogiques -- Problèmes de la personnalisation des structures de métadonnées -- Les annotations -- Annotations électroniques -- Catégorisation -- Les ontologies -- Le Web sémantique -- Resource description framework (RDF) -- OWL -- Architecture -- Problème de description des contenus -- Structure de description des métadonnées -- Annotations manuelles -- Hétérogénéité des descriptions RDF -- Alignement des ontologies -- Acteurs -- Méthodologie Prototype logiciel -- Analyse des résultats -- Durée -- Réutilisation des annotations -- Ontologies produites -- Réutilisation des ontologies -- Annogramme -- Facilité d'utilisation -- Comportement et attitude -- Contribution à l'avancement des connaissances

    Représentation OWL de la ressource lexicale LVF et son utilisation dans le traitement automatique de la langue

    Full text link
    Le dictionnaire LVF (Les Verbes Français) de J. Dubois et F. Dubois-Charlier représente une des ressources lexicales les plus importantes dans la langue française qui est caractérisée par une description sémantique et syntaxique très pertinente. Le LVF a été mis disponible sous un format XML pour rendre l’accès aux informations plus commode pour les applications informatiques telles que les applications de traitement automatique de la langue française. Avec l’émergence du web sémantique et la diffusion rapide de ses technologies et standards tels que XML, RDF/RDFS et OWL, il serait intéressant de représenter LVF en un langage plus formalisé afin de mieux l’exploiter par les applications du traitement automatique de la langue ou du web sémantique. Nous en présentons dans ce mémoire une version ontologique OWL en détaillant le processus de transformation de la version XML à OWL et nous en démontrons son utilisation dans le domaine du traitement automatique de la langue avec une application d’annotation sémantique développée dans GATE.The LVF dictionary (Les Verbes Français) by J. Dubois and F. Dubois-Charlier is one of the most important lexical resources in the French language, which is characterized by a highly relevant semantic and syntactic description. The LVF has been available in an XML format to make access to information more convenient for computer applications such as NLP applications for French language. With the emergence of the Semantic Web and the rapid diffusion of its technologies and standards such as XML, RDF/RDFS and OWL, it would be interesting to represent LVF in a more formalized format for a better and more sophisticated usage by natural language processing and semantic web applications. We present in this paper an OWL ontology version of LVF by demonstrating the mapping process between the data model elements of the XML version and OWL. We give account about its use in the field of natural language processing by presenting an application of semantic annotation developed in GATE

    LORESA : un système de recommandation d'objets d'apprentissage basé sur les annotations sémantiques

    Full text link
    Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

    Réalisation d'une visite virtuelle destinée aux publics du site Uni Mail de la Bibliothèque de l'Université de Genève

    Get PDF
    Ce mémoire a été rédigé suite à la réalisation d'un mandat pour le site Uni Mail de la Bibliothèque de l'Université de Genève, qui consistait en la création d'une visite guidée virtuelle de la bibliothèque prenant la forme de plusieurs vidéos et d’un audioguide. Dans un premier temps, notre groupe a dressé un état des lieux qui a permis de relever certains problèmes au sujet de l’orientation dans le bâtiment. Une analyse des besoins a ensuite été menée à travers une enquête auprès des étudiants (un public majoritaire à Uni Mail) et une série d'entretiens avec plusieurs personnes-ressources de la bibliothèque. Cette analyse a été complétée par un état de l’art des pratiques des bibliothèques en matière de visite guidée virtuelle. Les résultats de notre synthèse nous ont amenés à proposer un changement d’objectifs à nos mandantes : plutôt qu'un audioguide, dont l'efficacité était remise en cause, nous avons suggéré l'intégration de QR codes à divers endroits de la bibliothèque, renvoyant vers des informations plus détaillées sur le service ou l’objet en question et permettant ainsi d’offrir des contenus complémentaires aux vidéos. Dans un second temps, notre groupe s’est attelé à la partie pratique de ce travail de Bachelor, à savoir la réalisation des vidéos et des recommandations à propos des QR codes. Comme on peut l'imaginer, cette phase a demandé beaucoup de temps et d’énergie. En effet, en ce qui concerne les vidéos, nous avons d'abord dû sélectionner les informations essentielles à intégrer, rédiger les scripts puis les storyboards, supports essentiels au tournage ; rechercher des acteurs et tourner les différentes scènes, avant de passer à la postproduction. Pour les QR codes, notre démarche a débuté avec l'identification des contenus pertinents à inclure (qu'ils soient déjà existants ou devant être créés), ainsi que la sélection des meilleurs emplacements. En plus d'informer les usagers sur le fonctionnement de la bibliothèque, nous espérons que ces deux produits permettront de valoriser son image en montrant qu'elle adopte une attitude proactive vis-à-vis de l'évolution du public et de ses attentes. En effet, la bibliothèque peut, par le renforcement de sa présence sur le web, se rapprocher des étudiants qui y sont très présents. Les QR codes permettront à la bibliothèque d'expérimenter un créneau encore peu exploré dans le milieu bibliothéconomique (même si les pays anglo-saxons ont une longueur d’avance), mais populaire dans d’autres, comme la publicité. Ils témoigneront ainsi de la recherche constante de nouvelles solutions dont fait preuve la bibliothèque pour communiquer avec ses usagers et améliorer leur expérience au sein de ses murs

    Folksonomies, Thésaurus et Ontologies : trois artefacts combinés dans la structuration des données du Web

    Get PDF
    International audienceAu coeur de nos systèmes documentaires, de nos bibliothèques numériques, de nos systèmes d'information, du Web 2.0 et du Web Sémantique, les ontologies, les thésaurus et les folksonomies sont trois des structures de données qui participent à l'indexation des contenus. Parfois confondus, parfois opposés, nous montrons que ces trois « artefacts cognitifs » qui se répandent actuellement dans les applications Web répondent à des besoins différents et peuvent très bien être combinés au sein d'une même application pour permettre différentes fonctionnalités, offrant ainsi différents modèles et permettant différentes pratiques pour l'indexation de contenus en ligne

    Étude expérimentale du travail collaboratif entre producteurs de matériel de formation

    Get PDF
    Position terminologique et conceptuelle -- Étude empirique du travail collaboratif asynchrone entre des professeurs pour la production de matériel de formation -- Étude expérimentale du travail collaboratif asynchrone et synchrone pour la production d'exercices

    Système de recherche d’information étendue basé sur une projection multi-espaces

    Get PDF
    Depuis son apparition au début des années 90, le World Wide Web (WWW ou Web) a offert un accès universel aux connaissances et le monde de l’information a été principalement témoin d’une grande révolution (la révolution numérique). Il est devenu rapidement très populaire, ce qui a fait de lui la plus grande et vaste base de données et de connaissances existantes grâce à la quantité et la diversité des données qu'il contient. Cependant, l'augmentation et l’évolution considérables de ces données soulèvent d'importants problèmes pour les utilisateurs notamment pour l’accès aux documents les plus pertinents à leurs requêtes de recherche. Afin de faire face à cette explosion exponentielle du volume de données et faciliter leur accès par les utilisateurs, différents modèles sont proposés par les systèmes de recherche d’information (SRIs) pour la représentation et la recherche des documents web. Les SRIs traditionnels utilisent, pour indexer et récupérer ces documents, des mots-clés simples qui ne sont pas sémantiquement liés. Cela engendre des limites en termes de la pertinence et de la facilité d'exploration des résultats. Pour surmonter ces limites, les techniques existantes enrichissent les documents en intégrant des mots-clés externes provenant de différentes sources. Cependant, ces systèmes souffrent encore de limitations qui sont liées aux techniques d’exploitation de ces sources d’enrichissement. Lorsque les différentes sources sont utilisées de telle sorte qu’elles ne peuvent être distinguées par le système, cela limite la flexibilité des modèles d'exploration qui peuvent être appliqués aux résultats de recherche retournés par ce système. Les utilisateurs se sentent alors perdus devant ces résultats, et se retrouvent dans l'obligation de les filtrer manuellement pour sélectionner l'information pertinente. S’ils veulent aller plus loin, ils doivent reformuler et cibler encore plus leurs requêtes de recherche jusqu'à parvenir aux documents qui répondent le mieux à leurs attentes. De cette façon, même si les systèmes parviennent à retrouver davantage des résultats pertinents, leur présentation reste problématique. Afin de cibler la recherche à des besoins d'information plus spécifiques de l'utilisateur et améliorer la pertinence et l’exploration de ses résultats de recherche, les SRIs avancés adoptent différentes techniques de personnalisation de données qui supposent que la recherche actuelle d'un utilisateur est directement liée à son profil et/ou à ses expériences de navigation/recherche antérieures. Cependant, cette hypothèse ne tient pas dans tous les cas, les besoins de l’utilisateur évoluent au fil du temps et peuvent s’éloigner de ses intérêts antérieurs stockés dans son profil. Dans d’autres cas, le profil de l’utilisateur peut être mal exploité pour extraire ou inférer ses nouveaux besoins en information. Ce problème est beaucoup plus accentué avec les requêtes ambigües. Lorsque plusieurs centres d’intérêt auxquels est liée une requête ambiguë sont identifiés dans le profil de l’utilisateur, le système se voit incapable de sélectionner les données pertinentes depuis ce profil pour répondre à la requête. Ceci a un impact direct sur la qualité des résultats fournis à cet utilisateur. Afin de remédier à quelques-unes de ces limitations, nous nous sommes intéressés dans ce cadre de cette thèse de recherche au développement de techniques destinées principalement à l'amélioration de la pertinence des résultats des SRIs actuels et à faciliter l'exploration de grandes collections de documents. Pour ce faire, nous proposons une solution basée sur un nouveau concept d'indexation et de recherche d'information appelé la projection multi-espaces. Cette proposition repose sur l'exploitation de différentes catégories d'information sémantiques et sociales qui permettent d'enrichir l'univers de représentation des documents et des requêtes de recherche en plusieurs dimensions d'interprétations. L’originalité de cette représentation est de pouvoir distinguer entre les différentes interprétations utilisées pour la description et la recherche des documents. Ceci donne une meilleure visibilité sur les résultats retournés et aide à apporter une meilleure flexibilité de recherche et d'exploration, en donnant à l’utilisateur la possibilité de naviguer une ou plusieurs vues de données qui l’intéressent le plus. En outre, les univers multidimensionnels de représentation proposés pour la description des documents et l’interprétation des requêtes de recherche aident à améliorer la pertinence des résultats de l’utilisateur en offrant une diversité de recherche/exploration qui aide à répondre à ses différents besoins et à ceux des autres différents utilisateurs. Cette étude exploite différents aspects liés à la recherche personnalisée et vise à résoudre les problèmes engendrés par l’évolution des besoins en information de l’utilisateur. Ainsi, lorsque le profil de cet utilisateur est utilisé par notre système, une technique est proposée et employée pour identifier les intérêts les plus représentatifs de ses besoins actuels dans son profil. Cette technique se base sur la combinaison de trois facteurs influents, notamment le facteur contextuel, fréquentiel et temporel des données. La capacité des utilisateurs à interagir, à échanger des idées et d’opinions, et à former des réseaux sociaux sur le Web, a amené les systèmes à s’intéresser aux types d’interactions de ces utilisateurs, au niveau d’interaction entre eux ainsi qu’à leurs rôles sociaux dans le système. Ces informations sociales sont abordées et intégrées dans ce travail de recherche. L’impact et la manière de leur intégration dans le processus de RI sont étudiés pour améliorer la pertinence des résultats. Since its appearance in the early 90's, the World Wide Web (WWW or Web) has provided universal access to knowledge and the world of information has been primarily witness to a great revolution (the digital revolution). It quickly became very popular, making it the largest and most comprehensive database and knowledge base thanks to the amount and diversity of data it contains. However, the considerable increase and evolution of these data raises important problems for users, in particular for accessing the documents most relevant to their search queries. In order to cope with this exponential explosion of data volume and facilitate their access by users, various models are offered by information retrieval systems (IRS) for the representation and retrieval of web documents. Traditional SRIs use simple keywords that are not semantically linked to index and retrieve these documents. This creates limitations in terms of the relevance and ease of exploration of results. To overcome these limitations, existing techniques enrich documents by integrating external keywords from different sources. However, these systems still suffer from limitations that are related to the exploitation techniques of these sources of enrichment. When the different sources are used so that they cannot be distinguished by the system, this limits the flexibility of the exploration models that can be applied to the results returned by this system. Users then feel lost to these results, and find themselves forced to filter them manually to select the relevant information. If they want to go further, they must reformulate and target their search queries even more until they reach the documents that best meet their expectations. In this way, even if the systems manage to find more relevant results, their presentation remains problematic. In order to target research to more user-specific information needs and improve the relevance and exploration of its research findings, advanced SRIs adopt different data personalization techniques that assume that current research of user is directly related to his profile and / or previous browsing / search experiences. However, this assumption does not hold in all cases, the needs of the user evolve over time and can move away from his previous interests stored in his profile. In other cases, the user's profile may be misused to extract or infer new information needs. This problem is much more accentuated with ambiguous queries. When multiple POIs linked to a search query are identified in the user's profile, the system is unable to select the relevant data from that profile to respond to that request. This has a direct impact on the quality of the results provided to this user. In order to overcome some of these limitations, in this research thesis, we have been interested in the development of techniques aimed mainly at improving the relevance of the results of current SRIs and facilitating the exploration of major collections of documents. To do this, we propose a solution based on a new concept and model of indexing and information retrieval called multi-spaces projection. This proposal is based on the exploitation of different categories of semantic and social information that enrich the universe of document representation and search queries in several dimensions of interpretations. The originality of this representation is to be able to distinguish between the different interpretations used for the description and the search for documents. This gives a better visibility on the results returned and helps to provide a greater flexibility of search and exploration, giving the user the ability to navigate one or more views of data that interest him the most. In addition, the proposed multidimensional representation universes for document description and search query interpretation help to improve the relevance of the user's results by providing a diversity of research / exploration that helps meet his diverse needs and those of other different users. This study exploits different aspects that are related to the personalized search and aims to solve the problems caused by the evolution of the information needs of the user. Thus, when the profile of this user is used by our system, a technique is proposed and used to identify the interests most representative of his current needs in his profile. This technique is based on the combination of three influential factors, including the contextual, frequency and temporal factor of the data. The ability of users to interact, exchange ideas and opinions, and form social networks on the Web, has led systems to focus on the types of interactions these users have at the level of interaction between them as well as their social roles in the system. This social information is discussed and integrated into this research work. The impact and how they are integrated into the IR process are studied to improve the relevance of the results
    • …
    corecore