5 research outputs found

    ModÚle flexible pour la Recherche d'Information dans des corpus de documents semi-structurés

    Get PDF
    Structural information contained in semi-structured documents can be used to focus on relevant information. The aim of Information Retrieval System is then to retrieve relevant information units instead of whole documents. We propose here the XFIRM model (XML Flexible Information Retrieval model), which is based on: (i) a generic data representation model, allowing the modelling of documents having heterogeneous structures; (ii) a flexible query language that allows the expression of users needs according to many precision degrees, by expressing (or not) conditions on the documents structure; (iii) a retrieval model based on a relevance propagation method, which aims at finding the most exhaustive and specific information units answering the query. The interest of our propositions has been shown thanks to the prototype we developedLa nature de sources d'information Ă©volue, et les documents numĂ©riques traditionnels plats ne contenant que du texte s'enrichissent d'information structurelle et multimĂ©dia. Cette Ă©volution est accĂ©lĂ©rĂ©e par l'expansion du Web, et les documents semi-structurĂ©s de type XML (eXtensible Markup Language) tendent Ă  former la majoritĂ© des documents numĂ©riques mis Ă  disposition des utilisateurs. Le dĂ©veloppement d'outils automatisĂ©s permettant un accĂšs efficace Ă  ce nouveau type d'information numĂ©rique apparaĂźt comme une nĂ©cessitĂ©. Afin de valoriser au mieux l'ensemble des informations disponibles, les mĂ©thodes existantes de Recherche d'Information (RI) doivent ĂȘtre adaptĂ©es. L'information structurelle des documents peut en effet servir Ă  affiner le concept de granule documentaire. Le but pour les SystĂšmes de Recherche d'Information (SRI) est alors de retrouver des unitĂ©s d'information (et non plus de documents) pertinentes Ă  des requĂȘtes utilisateur. Afin de rĂ©pondre Ă  cette problĂ©matique fondamentale, de nouveaux modĂšles prenant en compte l'information structurelle des documents, tant au niveau de l'indexation, de l'interrogation que de la recherche doivent ĂȘtre construits. L'objectif de nos travaux est de proposer un modĂšle permettant d'effectuer des recherches flexibles dans des corpus de document semi-structurĂ©s. Ceci nous a conduit Ă  proposer le modĂšle XFIRM (XML Flexible Information Retrieval Model ) reposant sur : (i) Un modĂšle de reprĂ©sentation des donnĂ©es gĂ©nĂ©rique, permettant de modĂ©liser des documents possĂ©dant des structures diffĂ©rentes ; (ii) Un langage de requĂȘte flexible, permettant Ă  l'utilisateur d'exprimer son besoin selon divers degrĂ©s de prĂ©cision, en exprimant ou non des conditions sur la structure des documents ; (iii) Un modĂšle de recherche basĂ©e sur une mĂ©thode de propagation de la pertinence. Ce modĂšle a pour but de trouver les unitĂ©s d'information les plus exhaustives et spĂ©cifiques rĂ©pondant Ă  une requĂȘte utilisateur, que celle-ci contienne ou non des conditions de structure. Les documents semi-structurĂ©s peuvent ĂȘtre reprĂ©sentĂ©s sous forme arborescente, et le but est alors de trouver les sous-arbres de taille minimale rĂ©pondant Ă  la requĂȘte. Les recherches sur le contenu seul des documents sont effectuĂ©es en prenant en compte les importances diverses des feuilles des sous-arbres, et en plaçant ces derniers dans leur contexte, c'est Ă  dire, en tenant compte de la pertinence du document. Les recherches portant Ă  la fois sur le contenu et la structure des documents sont effectuĂ©es grĂące Ă  plusieurs propagations de pertinence dans l'arbre du document, et ce afin d'effectuer une correspondance vague entre l'arbre du document et l'arbre de la requĂȘte. L'Ă©valuation de notre modĂšle, grĂące au prototype que nous avons dĂ©veloppĂ©, montre l'intĂ©rĂȘt de nos propositions, que ce soit pour effectuer des recherches sur le contenu seul des documents que sur le contenu et la structure

    Formsheets and the XML Forms Language

    No full text
    This paper presents XForm---a proposal for a general and powerful mechanism for handling forms in XML. XForm defines form-related constructs independent of any particular XML language and set of form controls. It defines the notion of formsheets as a mechanism for computing form values on the client, form values being arbitrary, typed XML documents. This enables a symmetrical exchange of data between clients and servers which is useful for example for database and workflow applications. Formsheets can be written in a variety of languages---we argue that the document transformation capabilities of XSL stylesheets make them an elegant choice. Keywords: XML; form; formsheet; XForm; XSL 1. Introduction HTML defines a number of elements which taken together allows authors to construct forms---elements which can be used to solicit input from a user [13]. HTML forms have proven themselves extremely useful and after hyperlinking must be said to be the most important way of performing ..

    Formsheets and the XML forms language

    No full text
    SIGLEAvailable from British Library Document Supply Centre-DSC:4335.26205(1999-41) / BLDSC - British Library Document Supply CentreGBUnited Kingdo

    Formsheets and the XML forms language

    No full text
    corecore