200 research outputs found

    Utilisation de la langue naturelle pour l'interrogation de documents structurés

    Get PDF
    http://www.asso-aria.org/coria/2005/19.pdfInternational audienceLe langage de requĂȘte est l'indispensable interface entre l'utilisateur et l'outil de recherche. SimplifiĂ© au maximum dans les cas oĂč les moteurs indexent essentiellement des documents plats, il devient fort complexe lorsqu'il s'adresse Ă  des documents structurĂ©s et qu'il s'a git de dĂ©finir des contraintes portant Ă  la fois sur la structure et le contenu. L'approche ici- dĂ©crite propose d'utiliser la langue naturelle comme interface pour exprimer de telles requĂȘtes. L'article dĂ©crit dans un premier temps les diffĂ©rentes phases qui permettent de transformer (dans un cadre de recherche d'information) la requĂȘte en langage naturel en une reprĂ©sentation sĂ©mantique indĂ©pendante du contexte. Des rĂšgles de simplification adaptĂ©es Ă  la structure et au domaine du corpus sont ensuite appliquĂ©es, permettant d'obtenir une forme finale, adaptĂ©e Ă  une conversion ver s un langage de requĂȘte formel. L'article dĂ©crit enfin les expĂ©rimentations effectuĂ©es et tir e les premiĂšres conclusions sur divers aspects de cette approche

    Structuration sématique de documents XML centres-documents

    Get PDF
    La numĂ©risation des documents et le dĂ©veloppement des technologies Internet ont engendrĂ© une augmentation permanente du nombre de documents et de types de documents disponibles. Face Ă  cette masse documentaire, XML (eXtensible Markup Language) s’est imposĂ© comme format standard de structuration et d’échange de documents. Ainsi, un nombre de plus en plus important de documents devient disponible sous ce format. Ces documents XML peuvent ĂȘtre classĂ©s en deux types : les documents XML orientĂ©-donnĂ©es et les documents XML orientĂ©-textes. Les documents XML orientĂ©-donnĂ©es sont constituĂ©s d’un ensemble d’élĂ©ments gĂ©nĂ©ralement courts et prĂ©cis et sont similaires aux donnĂ©es relationnelles. Nous constatons que les balises utilisĂ©es pour ce type de documents dĂ©crivent gĂ©nĂ©ralement d’une maniĂšre prĂ©cise le contenu, et offrent la sĂ©mantique basique nĂ©cessaire Ă  la description de l’information (Exemples de balises : Article, Client, QuantitĂ©, Prix). A contrario, les documents XML orientĂ©-textes sont riches en texte et utilisent des balises qui reflĂštent la plupart du temps un dĂ©coupage (structurel) logique (exemples de balises : Contenu, Section, Paragraphe). Malheureusement, ces balises n’ont qu’une trĂšs pauvre vocation sĂ©mantique. Partant de cette constatation, le dĂ©veloppement d’approches supportĂ©es par des outils automatisĂ©s permettant de dĂ©crire la sĂ©mantique des documents XML orientĂ©s-textes devient un besoin urgent, voire une nĂ©cessitĂ© pour certains usages. Dans ce contexte, nous proposons une approche de structuration sĂ©mantique des documents XML Ă  partir de leurs structures logiques et de leurs contenus. Elle construit une arborescence de concepts. Cette approche de structuration sĂ©mantique passe par quatre phases : 1) Extraction des termes des contenus des documents en utilisant des techniques de recherche d’information ; 2) DĂ©termination d’une taxonomie1 qui sera affectĂ©e au document, c’est-Ă -dire celle qui correspond au mieux Ă  sa sĂ©mantique (cette Ă©tape se base sur une dĂ©marche de pondĂ©ration d’un ensemble de taxonomies candidates) ; 3) Affectation, Ă  chaque Ă©lĂ©ment feuille de la structure logique du document, du concept le plus significatif Ă  partir de la taxonomie retenue ; 4) InfĂ©rence de concepts aux Ă©lĂ©ments non feuilles du document. Notre approche de structuration sĂ©mantique des documents se base sur l’indexation sĂ©mantique et diffĂšre des autres travaux par : 1) Le choix d’une taxonomie appropriĂ©e pour chaque document, il s’agit de dĂ©terminer la taxonomie qui dĂ©crit au mieux la sĂ©mantique du document, et 2) La pondĂ©ration des concepts extraits de maniĂšre Ă  donner plus d’importance aux concepts les plus spĂ©cifiques car nous partons du constat suivant : plus le niveau auquel se situe le concept est bas dans la hiĂ©rarchie, plus l’information qu’il apporte est fine et ciblĂ©e. Pour exploiter ces structures sĂ©mantiques, nous avons Ă©tendu le mĂ©ta-modĂšle d’entrepĂŽts de documents pour assurer leur stockage. De plus, nous avons introduit le concept de mĂ©tadocument afin de permettre l’interrogation de ces structures sĂ©mantiques. Enfin, pour Ă©valuer nos propositions, nous avons menĂ© un ensemble d’expĂ©rimentations sur la collection de documents XML ImageCLEFMed 2010 en utilisant la ressource sĂ©mantique MeSH (NML's Medical Subject Headings). Les rĂ©sultats obtenus montrent que l’algorithme de pondĂ©ration des concepts des taxonomies qui a Ă©tĂ© proposĂ© permet de sĂ©lectionner avec prĂ©cision la taxonomie pertinente pour un document donnĂ© et, en consĂ©quence, les concepts pertinents Ă  affecter aux Ă©lĂ©ments feuilles de la structure sĂ©mantique de ce document.Le rĂ©sumĂ© en anglais n'a pas Ă©tĂ© communiquĂ© par l'auteur

    Structuration sématique de documents XML centres-documents

    Get PDF
    La numĂ©risation des documents et le dĂ©veloppement des technologies Internet ont engendrĂ© une augmentation permanente du nombre de documents et de types de documents disponibles. Face Ă  cette masse documentaire, XML (eXtensible Markup Language) s’est imposĂ© comme format standard de structuration et d’échange de documents. Ainsi, un nombre de plus en plus important de documents devient disponible sous ce format. Ces documents XML peuvent ĂȘtre classĂ©s en deux types : les documents XML orientĂ©-donnĂ©es et les documents XML orientĂ©-textes. Les documents XML orientĂ©-donnĂ©es sont constituĂ©s d’un ensemble d’élĂ©ments gĂ©nĂ©ralement courts et prĂ©cis et sont similaires aux donnĂ©es relationnelles. Nous constatons que les balises utilisĂ©es pour ce type de documents dĂ©crivent gĂ©nĂ©ralement d’une maniĂšre prĂ©cise le contenu, et offrent la sĂ©mantique basique nĂ©cessaire Ă  la description de l’information (Exemples de balises : Article, Client, QuantitĂ©, Prix). A contrario, les documents XML orientĂ©-textes sont riches en texte et utilisent des balises qui reflĂštent la plupart du temps un dĂ©coupage (structurel) logique (exemples de balises : Contenu, Section, Paragraphe). Malheureusement, ces balises n’ont qu’une trĂšs pauvre vocation sĂ©mantique. Partant de cette constatation, le dĂ©veloppement d’approches supportĂ©es par des outils automatisĂ©s permettant de dĂ©crire la sĂ©mantique des documents XML orientĂ©s-textes devient un besoin urgent, voire une nĂ©cessitĂ© pour certains usages. Dans ce contexte, nous proposons une approche de structuration sĂ©mantique des documents XML Ă  partir de leurs structures logiques et de leurs contenus. Elle construit une arborescence de concepts. Cette approche de structuration sĂ©mantique passe par quatre phases : 1) Extraction des termes des contenus des documents en utilisant des techniques de recherche d’information ; 2) DĂ©termination d’une taxonomie1 qui sera affectĂ©e au document, c’est-Ă -dire celle qui correspond au mieux Ă  sa sĂ©mantique (cette Ă©tape se base sur une dĂ©marche de pondĂ©ration d’un ensemble de taxonomies candidates) ; 3) Affectation, Ă  chaque Ă©lĂ©ment feuille de la structure logique du document, du concept le plus significatif Ă  partir de la taxonomie retenue ; 4) InfĂ©rence de concepts aux Ă©lĂ©ments non feuilles du document. Notre approche de structuration sĂ©mantique des documents se base sur l’indexation sĂ©mantique et diffĂšre des autres travaux par : 1) Le choix d’une taxonomie appropriĂ©e pour chaque document, il s’agit de dĂ©terminer la taxonomie qui dĂ©crit au mieux la sĂ©mantique du document, et 2) La pondĂ©ration des concepts extraits de maniĂšre Ă  donner plus d’importance aux concepts les plus spĂ©cifiques car nous partons du constat suivant : plus le niveau auquel se situe le concept est bas dans la hiĂ©rarchie, plus l’information qu’il apporte est fine et ciblĂ©e. Pour exploiter ces structures sĂ©mantiques, nous avons Ă©tendu le mĂ©ta-modĂšle d’entrepĂŽts de documents pour assurer leur stockage. De plus, nous avons introduit le concept de mĂ©tadocument afin de permettre l’interrogation de ces structures sĂ©mantiques. Enfin, pour Ă©valuer nos propositions, nous avons menĂ© un ensemble d’expĂ©rimentations sur la collection de documents XML ImageCLEFMed 2010 en utilisant la ressource sĂ©mantique MeSH (NML's Medical Subject Headings). Les rĂ©sultats obtenus montrent que l’algorithme de pondĂ©ration des concepts des taxonomies qui a Ă©tĂ© proposĂ© permet de sĂ©lectionner avec prĂ©cision la taxonomie pertinente pour un document donnĂ© et, en consĂ©quence, les concepts pertinents Ă  affecter aux Ă©lĂ©ments feuilles de la structure sĂ©mantique de ce document.Le rĂ©sumĂ© en anglais n'a pas Ă©tĂ© communiquĂ© par l'auteur

    Actes de la conférence conjointe JEP-TALN-RECITAL 2016, volume 09 : ELTAL

    Get PDF
    National audienceELTAL is a workshop organized within the JEP-TALN-RECITAL 2016 conference. This workshop brings together papers investigating metdods and applications in NLP applied to language teaching.ELTAL est un atelier organisé au sein de la conférence JEP-TALN-RECITAL 2016 et regroupe des contributions qui étudient les méthodes et les applications en TAL dans le domaine de l'enseignement des langues

    Modélisation informatique de structures dynamiques de segments textuels pour l'analyse de corpus

    No full text
    The objective of the thesis is to propose a data-processing model to represent, build and exploit textualstructures. The suggested model relies on a «type/token» form of text representation extended bysystems of lexical and contextual annotations. This model's establishment was carried out in the SATOsoftware -- of which the functionalities and the internal organization are presented. Reference to anumber of works give an account of the development and use of the software in various contexts.The formal assumption of the textual and discursive structures find an ally in the beaconing XMLlanguage and the proposals of the Text Encoding Initiative (TEI). Formally, the structures built on thetextual segments correspond to graphs. In a development driven textual analysis context, these graphsare multiple and partially deployed. Their resolution, within the fastening of the nodes to textualsegments or that of other graphs, is a dynamic process which can be sustained by various dataprocessingmechanisms. Examples drawn from textual linguistics are used to illustrate the principles ofstructural annotation. Prospective considerations for the data-processing establishment of amanagement system of the structural annotation are also exposed.L'objectif de la thĂšse est de proposer un modĂšle informatique pour reprĂ©senter, construire et exploiterdes structures textuelles. Le modĂšle proposĂ© s'appuie sur une reprĂ©sentation du texte sous la forme d'unplan lexique/occurrences augmentĂ© de systĂšmes d'annotations lexicales et contextuelles, modĂšle dontune implantation a Ă©tĂ© rĂ©alisĂ©e dans le logiciel SATO dont on prĂ©sente les fonctionnalitĂ©s etl'organisation interne. La prĂ©sentation d'un certain nombre de travaux rendent compte dudĂ©veloppement et de l'utilisation du logiciel dans divers contextes.La prise en charge formelle des structures textuelles et discursives trouve un alliĂ© dans le langage debalisage XML et dans les propositions de la Text Encoding Initiative (TEI). Formellement, lesstructures construites sur les segments textuels correspondent Ă  des graphes. Dans le contexte d'uneanalyse textuelle en Ă©laboration, ces graphes sont multiples et partiellement dĂ©ployĂ©s. La rĂ©solution deces graphes, au sens du rattachement des noeuds Ă  des segments textuels ou Ă  des noeuds d'autresgraphes, est un processus dynamique qui peut ĂȘtre soutenu par divers mĂ©canismes informatiques. Desexemples tirĂ©s de la linguistique textuelle servent Ă  illustrer les principes de l'annotation structurelle.Des considĂ©rations prospectives sur une implantation informatique d'un systĂšme de gestion del'annotation structurelle sont aussi exposĂ©es

    Autisme : une médiation en-jouée

    Get PDF
    Ce mĂ©moire s'interroge sur les apports de l'activitĂ© ludique dans la relation enseignant/enfant autiste. Le jeu y est analysĂ© Ă  travers sa fonction de mĂ©diation. Il propose un support rĂ©flexif de dĂ©part de ce que peut ĂȘtre la mĂ©diation en-jouĂ©e avec l'enfant autiste

    ModĂ©lisation et mise en Ɠuvre d'environnements informatiques pour la rĂ©gulation de l'apprentissage, le cas de l'algĂšbre avec le projet LINGOT

    Get PDF
    200 pagesCe projet a pour objectif de mettre à la disposition des enseignants des outils performants pour un travail plus individualisé avec des élÚves dans le domaine de l'algÚbre élémentaire. Le travail s'appuie sur des recherches théoriques en Didactique des Mathématiques et en Environnements Informatiques d'Apprentissage Humain. Le projet a produit un logiciel, appelé Pépite, qui construit automatiquement le profil cognitif en algÚbre d'un élÚve du secondaire à partir de ses réponses à un test spécialement élaboré à cet effet
    • 

    corecore