8 research outputs found

    Conception d'un outil d'aide \`a l'indexation de ressources p\'edagogiques - Extraction automatique des th\'ematiques et des mots-clefs de documents UNIT

    Get PDF
    Indexing learning documents using the Learning Object Metadata (LOM) is often carried out manually by archivists. Filling out the LOM fields is a long and difficult task, requiring a complete reading and a full knowledge on the topic dealt within the document. In this paper, we present an innovative model and method to assist the archivists in finding the important concepts and keywords of a learning document. The application is performed using wikipedia's category links

    Impact des variations morphologiques sur la recherche d'information sur le Web

    Get PDF
    Notre travail de recherche est de type exploratoire. Il traite de l'apport des connaissances linguistiques à la recherche d'information sur le Web. Plus spécifiquement, nous avons étudié l'impact des variations morphologiques, notamment les variantes dérivées, en termes de fréquence, sur la pertinence des documents rapportés. À ce sujet, nous avons vérifié s'il y a une corrélation entre la fréquence des termes et des variantes morphologiques extraits des documents rapportés et la pertinence de ces mêmes documents. Les résultats obtenus n'ont pas permis de confirmer, d'une façon évidente, cette corrélation. En d'autres termes, si les données brutes laissent croire que, globalement, il y a une corrélation entre la fréquence des variables et la pertinence des documents, ce n'est pas le cas après l'examen des requêtes d'une façon individuelle, et, aussi, après l'application du test statistique de Jonckheere-Terpstra. En somme, la présence ou non d'une telle corrélation dépend, en partie, de la requête, des mots de la requête, de la nature et de la qualité des variantes. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Recherche d'information, Connaissances linguistiques, Variations morphologiques, Reformulation de requêtes, Traitement automatique des langues, Web

    L’apport des nouvelles technologies de reconnaissances d’images et d’indexation à la recherche historique et à la diffusion des archives photographiques

    Get PDF
    L’indexation et la diffusion des images sont en constante évolution dans le domaine de l’archivistique et de la recherche en histoire. En effet, la numérisation des archives photographiques et l’explosion de la photographie numérique nous obligent à réfléchir à l’intégration de nouvelles méthodes pour l’indexation de ces images. Ce travail de recherche se penche donc sur la perspective d’améliorer l’accessibilité des archives photographiques et leur potentiel pour la recherche historique grâce à l’apport des nouvelles technologies de reconnaissances d’images et d’indexation. Afin d’éviter que cette richesse archivistique demeure sous-exploitée, les centres auront besoin de nouveaux outils pour favoriser la diffusion de ces images. Ce mémoire propose donc une réflexion sur les concepts et les méthodes d’indexation et sur l’état des techniques d’intelligence artificielle permettant la reconnaissance d’images. Une telle approche permettra d’ajouter une liste de mots automatique dans les échelons supérieurs de la taxonomie, offrant ainsi une plus grande cohérence et une meilleure uniformité entre les collections. L’indexation humaine des sujets plus pointus faciliteront ensuite la recherche ciblée dans les collections et ainsi rendra les documents plus accessibles aux chercheurs. Ceux-ci pourront ainsi exécuter des recherches plus prévisibles dans les grandes catégories d’information et disposer d’informations précises pour les recherches ciblées. Bref, l’ajout des technologies de reconnaissance de formes et d’indexation automatisée va favoriser la diffusion des images, mais aussi, la démocratisation du savoir. Elles établissent une complémentarité entre le travail des archivistes, la mise en ligne des sources et les besoins des chercheurs

    La position initiale dans l'organisation du discours : <br />une exploration en corpus

    Get PDF
    This thesis proposes an exploratory study of discourse organization based on a written French corpus of 700.000 words. It focuses on initial position (defined as the pre-verbal zone) constituting the starting point for textual units at different levels of granularity: sections, paragraphs and sentences. Initial position is relevant in both cognitive and discourse linguistics. It is in this position that the speaker expresses the crucial information and it is from there that the reader's interpretation proceeds. Crucial information may consist in marking either continuity (e.g. expressing old information first) or discontinuity (e.g. indicating that the discourse frame in which incoming information is to be interpreted has changed).All pre-verbal zones in the corpus have been automatically annotated (23217 sentences) and their composition has been quantitatively analysed. Our data show that the discourse role of elements that appear in initial position is significantly related to discourse factors, and more precisely to the following three factors: text-type, textual position, and collocations in initial position.Cette thèse propose une étude exploratoire de l'organisation du discours basée sur un corpus de français écrit (700 000 mots). L'organisation du discours est abordée par la position initiale définie en tant que point de départ d'unités textuelles pouvant relever de trois niveaux d'organisation : les phrases, les paragraphes et les sections. La position initiale est un sujet d'étude commun à la linguistique cognitive et à la linguistique du discours. C'est en cette position que l'auteur exprime l'information cruciale et c'est sur la base de cette information que l'interprétation du lecteur se réalise. L'information cruciale peut consister à marquer une continuité dans le discours (par exemple en commençant l'unité textuelle par une information donnée) ou une discontinuité (en signalant par exemple que le cadre dans lequel interpréter les propos a changé).Toutes les zones préverbales du corpus ont été annotées automatiquement. L'analyse quantitative de leur composition montre que le rôle discursif des éléments en position initiale varie significativement selon des facteurs discursifs tels que le type de texte, la position textuelle et les collocations présentes en cette position

    Bibliothèques numériques et crowdsourcing: Expérimentations autour de Numalire, projet de numérisation à la demande par crowdfunding

    Get PDF
    Instead of outsource tasks to providers in cheap labour countries, libraries increasingly appeal to online crowds, making relationship with their users more collaborative. The PhD begins with a conceptual chapter on the consequences of this new economic model on society and on libraries. Then, an overview of the projects is presented in the areas of digitization on demand (crowdfunding) and OCR correction with gamification and folksonomy. It is followed by a state of the art, a review and analysis on crowdsourcing applied to digitization and digital libraries. Finally, conceptual contributions and original experiments, with Numalire, a crowdfunding and digitization on demand project are presented.Au lieu d’externaliser certaines tâches auprès de prestataires ayant recours à des pays dont la main d’œuvre est bon marché, les bibliothèques dans le monde font de plus en plus appel aux foules d’internautes, rendant plus collaborative leur relation avec les usagers. Après un chapitre conceptuel sur les conséquences de ce nouveau modèle économique sur la société et sur les bibliothèques, un panorama des projets est présenté dans les domaines de la numérisation à la demande, de la correction participative de l’OCR notamment sous la forme de jeux (gamification) et de la folksonomie. Ce panorama débouche sur un état de l’art du crowdsourcing appliqué à la numérisation et aux bibliothèques numériques et sur des analyses dans le domaine des sciences de l’information et de la communication. Enfin, sont présentées des apports conceptuels et des expérimentations originales, principalement autour du projet Numalire de numérisation à la demande par crowdfunding

    La fiction hypermédiatique : une analyse intermédiale des relations entre la fiction, la narrativité et les médias numériques

    Get PDF
    Cette thèse porte sur la fiction hypermédiatique. Elle analyse les relations entre la fiction, la narrativité et les environnements hypermédiatiques selon une perspective sémiotique et intermédiale. Les nouvelles formes fictionnelles et narratives engendrées par les technologies numériques, où prédomine un mode spatial, sont mises en relation avec leurs précurseurs et leurs avenues prospectives. Le concept d'hypermédialité est élargi afin d'inclure des dispositifs qui ne dépendent pas nécessairement de technologies complexes. Par extension, il désigne un mode de configuration en réseau faisant appel à plusieurs médias disséminés dans l'espace. Formes hétéroclites, les propositions contemporaines prolongent plusieurs pratiques artistiques issues des domaines littéraire, filmique, scénique et environnemental, ou encore elles constituent de nouvelles formes autonomes. La thèse gravite autour d'une question centrale: Comment les environnements hypermédiatiques instaurent-ils de nouvelles formes fictionnelles et comment le sujet humain construit-il la signification à partir d'elles? Nous investiguerons la manière dont les environnements hypermédiatiques peuvent devenir le support de nouvelles propositions fictionnelles, en explorant d'abord les genres constitués de la fiction hypermédiatique, pour en développer ensuite l'analyse critique. La thèse tentera de cerner comment la fiction hypermédiatique se lie à des précurseurs. Par exemple, les fictions encyclopédiques, les arts de mémoire, la cathédrale médiévale, les villes utopiques ou les théâtres encyclopédiques de la Renaissance préfigurent les formes actuelles. L'hypermédialité se manifeste également dans des formes cinématographiques ou scéniques en relation avec les mondes virtuels du cyberespace. En partant de ces précurseurs, nous tenterons d'explorer de manière prospective comment ces formes peuvent évoluer en déployant des imaginaires signifiants du point de vue de l'expérience humaine. La première partie de la thèse examinera deux genres existants de la fiction hypermédiatique, soit l'hyperfiction textuelle et le jeu interactif, en relation avec les théories narratologiques. Nous appuyons la réflexion sur les concepts de textualité, de médialité et d'interface. Le premier chapitre se centrera sur l'évolution des questions ayant balisé l'étude des oeuvres de première génération jusqu'aux formes actuelles. Il fera un survol de positions théoriques ayant influencé l'étude des formes de fiction émergentes. Il développera une analyse critique des premières formes de l'hyperfiction textuelle en mettant en évidence l'importance de la prise en compte du sujet dans l'analyse. Dans le deuxième chapitre, nous aborderons le problème de la tension entre deux modes de configuration qui, de prime abord, entrent en conflit dans les environnements interactifs: soit les principes narratif et associatif. Nous demanderons alors comment réconcilier ces deux principes, réflexion qui se poursuivra tout au long de la thèse. Nous verrons que les environnements hypermédiatiques ne construisent pas des formes du récit à l'état pur : le principe narratif se conjugue avec des traits encyclopédiques ou ludiques. En analysant d'abord les relations entre les notions de jeu et de récit, le troisième chapitre se centrera sur les mondes fictionnels et les espaces ludiques des jeux interactifs. La seconde partie se tournera vers les formes prospectives en élargissant les corpus, allant du cinéma aux formes scéniques et aux environnements architecturaux. Pour cela, nous adopterons d'abord une approche historicisée. Au cours du quatrième chapitre, nous convoquerons dans notre analyse les arts de la mémoire issus de la tradition rhétorique ainsi que les théâtres encyclopédiques de la Renaissance, pour montrer comment les formes hypermédiatiques naissent du croisement entre les principes narratif et associatif. Puis, au cours du chapitre cinq, en élargissant les corpus au cinéma étendu ou aux dispositifs de réalité virtuelle, nous ferons appel aux concepts d'immersion, de présence ainsi que de simulation. En s'appuyant sur le concept de réalités mixtes, le chapitre six traitera des espaces navigationnels par le biais de la cognition spatiale et des relations entre espaces matériels et virtuels. L'analyse s'appuiera sur l'étude des mondes virtuels du cyberespace et des environnements urbains investis par les technologies numériques. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Fiction, Hypermédia, Spatialité, Narrativité, Remédiation, Espaces ludiques, Immersion, Présence, Agentivité, Réalités virtuelles, Réalités augmentées, Réalités mixtes
    corecore