3 research outputs found

    Arquitetura para recuperação de informação em documentos anotados usando semântica

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação.O presente trabalho apresenta uma arquitetura de recuperação de informação em nível semântico para documentos anotados. Tal arquitetura visa organizar os recursos de informação e permitir que usuários tenham maior precisão quanto aos resultados das consultas por documentos de seus interesses. A abordagem se faz importante, pois os usuais meios de recuperação de informação não são capazes de restringir os resultados das consultas. Isso ocorre em virtude da grande quantidade de dados indexados e a pouca capacidade em analisá-los. A arquitetura aqui apresentada baseia-se em ontologias para responder às consultas mais avançadas efetuadas pelos usuários. Ontologias possuem grande capacidade em representar conhecimento, provendo uma fonte muito rica para responder a requisições. Assim, aplicações desenvolvidas dentro dessa concepção têm capacidade de recuperar, além de informações explícitas, também informações implícitas aos usuários. É apoiando-se sobre essa constatação que se desenvolve este trabalho. São apresentados os principais conceitos sobre a área, métodos de recuperação de informação e a arquitetura proposta para recuperação de informação usando ontologias

    Retrieving information from compressed XML documents according to vague queries

    Get PDF
    XML has become the standard way for representing and transforming data over the World Wide Web. The problem with XML documents is that they have a very high ratio of redundancy, which makes these documents demanding large storage capacity and high network band-width for transmission. Because of their extensive use, XML documents could be retrieved according to vague queries by naive users with poor background in writing XPath query. The aim of this thesis is to present the design of a system named “XML Compressing and Vague Querying (XCVQ)” which has the ability of compressing the XML document and retrieving the required information from the compressed version with less decompression required according to vague queries. XCVQ first compressed the XML document by separating its data into containers and then compress these containers using the GZip compressor. The compressed file could be retrieved if a vague query is submitted without the need to decompress the whole file. For the purpose of processing the vague queries, XCVQ decomposes the query according to the relevant documents and then a second decomposition stage is made according to the relevant containers. Only the required information is decompressed and submitted to the user. To the best of our knowledge, XCVQ is the first XML compressor that has the ability to process vague queries. The average compression ratio of the designed compressor is around 78% which may be considered competitive compared to other queriable XML compressors. Based on several experiments, the query processor part had the ability to answer different kinds of vague queries ranging from simple exact match queries to complex ones that require retrieving information from several compressed XML documents.EThOS - Electronic Theses Online ServiceGBUnited Kingdo
    corecore