3,385 research outputs found

    Ambiguity in information retrieval

    Get PDF
    Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural. _____________________________________________________________________________________________ ABSTRACTTIssues relative to information extraction from complete texts and subsequent retrieval by means of automatic natural language treatment methods are discussed. Besides extracting words from the text, the relationship of significance that these words have in the context of the speech in which they occur is attempted to be preserved. An information retrieval system using natural language should be able to treat given linguistic phenomena that affect the quality of information, such as, for instance, the issues of ambiguity. The Valence Grammar and the Conceptual Graphics are used as theoretical and methodological. An automatic natural language treatment system – Zstation – is utilized, as well as a pool of official documents concerning the Mercosul, for the ambiguity solutions tests. The conclusion is reached that a natural language treatment system can solve certain types of ambiguities when information is available regarding the syntactic-semantic valence of the lexical units that compose an enunciation. The results obtained show that it is possible to introduce automatic procedures for solving ambiguities in a natural language treatment. syste

    UMA ABORDAGEM BASEADA EM ONTOLOGIAS PARA INTEGRAÇÃO SEMÂNTICA DE SISTEMAS

    Get PDF
    Geralmente, sistemas são construídos por diferentes desenvolvedores, em diferentes momentos, sem uma preocupação com o estabelecimento de um significado comum aos itens comunicados pelos mesmos. Em geral, cada sistema é executado separadamente e implementa o seu próprio modelo de dados e de processo. Esses modelos não são compartilhados entre os sistemas, o que abre espaço para diversos tipos de conflitos, incluindo conflitos sintáticos e semânticos. Essa heterogeneidade é considerada uma das maiores dificuldades no problema da integração. Neste contexto, ontologias podem ser usadas como uma interlíngua para mapear conceitos e serviços usados por diferentes sistemas, que acessariam dados e serviços por meio de ontologias compartilhadas. Neste presente trabalho defende-se a ideia de que a integração semântica é uma tarefa complexa e bastante subjetiva e, por isso, deve ocorrer em um nível mais alto de abstração. Tomando por base esta consideração, foi desenvolvida OBA-SI (Ontology-Based Approach for Semantic Integration), uma abordagem de integração semântica de sistemas que concentra esforços na modelagem conceitual e na análise dos requisitos de integração. Nessa abordagem, a integração semântica é realizada em um alto nível de abstração, provendo acordo semântico entre os sistemas no nível conceitual. OBA-SI lida com a integração nas três camadas de integração: dados, serviços e processos. Para tal, modelos conceituais dos sistemas (representando sua estrutura e comportamento), bem como do processo de negócio por eles apoiado, são comparados à luz de ontologias, usadas para atribuir semântica aos itens compartilhados entre os sistemas no apoio ao processo de negócio considerado. Os modelos são compatibilizados por meio de mapeamentos entre seus elementos. Todo esse processo de atribuição de semântica e uso de ontologias é independente da solução da integração. A fim de se testar a presente abordagem, foi realizado um estudo de caso no qual ela foi aplicada na integração semântica de dois sistemas de Gerência de Configuração de Software, usando ontologias de domínio e de tarefa

    APLICABILIDADE DA FOLKSONOMIA NA CONSTRUÇÃO E ATUALIZAÇÃO DE SISTEMAS HÍBRIDOS DE ORGANIZAÇÃO DO CONHECIMENTO

    Get PDF
    Studies aspects related to Folksonomy and the collaborative representation of information in Information Retrieval Systems. Presents its main characteristics, positive and negative implications in the process of representation and information retrieval. General objective is to analyze the applicability of Folksonomy in the process of building and updating hybrid Knowledge Organization Systems, based on the results of national and international research in the literature. Uses bibliographic, exploratory, descriptive research with a qualitative approach as a methodology. Highlights the main contributions of the tools that combine the systematized structure of traditional knowledge representation tools with the latent semantics of Folksonomy in Information Retrieval Systems. Presents proposals that explore the potential of Folksonomy with the support of formalisms and methods used in the construction of terminological control instruments, revealing new perspectives to help the representation and exchange of knowledge in a web environment.Estuda aspectos relativos à Folksonomia e à representação colaborativa da informação em Sistemas de Recuperação da Informação. Apresenta as suas principais características, implicações positivas e negativas no processo de representação e recuperação da informação. Tem como objetivo geral analisar a aplicabilidade da Folksonomia no processo de construção e atualização de Sistemas híbridos de Organização do Conhecimento, a partir dos resultados de pesquisas nacionais e internacionais na literatura. Utiliza como metodologia as pesquisas bibliográfica, exploratória, descritiva com abordagem qualitativa. Evidencia os principais contributos das ferramentas que combinam a estrutura sistematizada dos instrumentos tradicionais de representação do conhecimento à semântica latente da Folksonomia em Sistemas de Recuperação da Informação. Apresenta propostas que exploram as potencialidades da Folksonomia com o suporte dos formalismos e métodos utilizados na construção de instrumentos de controle terminológicos, descortinando novas perspectivas para auxiliar a representação e a troca de conhecimentos em ambiente web

    Representação do conhecimento sobre pragas e doenças do café: esquemas conceituais e recursos terminológicos.

    Get PDF
    Neste documento é apresentado o relato de um trabalho de desenvolvimento de alguns formatos de representação do conhecimento sobre pragas e doenças do cafeeiro, realizado no âmbito do projeto "Tecnologia da Informação para o manejo integrado de doenças e pragas do cafeeiro: modelagem, representação do conhecimento e ferramentas computacionais de diagnóstico e alerta".bitstream/item/218081/1/Doc167-2020.pd

    Um modelo baseado em ontologia e extração de informação como suporte ao processo de design instrucional na geração de mídias do conhecimento

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, 2014.A educação à distância (EAD) é uma realidade em expansão. Sobre esta evolução está o design instrucional permeando as equipes de produção para cursos em EAD. Nesta tese o objetivo foi propor um modelo baseado em ontologia e extração da informação como suporte ao processo de design instrucional na geração de mídias do conhecimento. Sendo assim, esta tese propõe um modelo que tivesse como suporte ontologias de domínio para a EAD - pois todo material instrucional de um curso de EAD nasce de um texto bruto (corpus). Com a intuição de auxiliar a fase de implementação do designer instrucional sob a leitura deste texto bruto, foi criado um modelo de representação baseado em ontologia para que o mesmo possa projetar ao designer instrucional as categorias básicas sobre o texto. Para isso, ao trabalhar o texto bruto, o designer instrucional pode se atribuir de uma ferramenta de extração de informação e, por consequência, agilizar seus insumos de trabalho. É importante destacar que o modelo aqui proposto se expande e funciona em sua totalidade através da integração com outras ontologias para realizar uma representação gráfica do corpus: que expõe conexões existentes entre os termos e como eles podem ainda, em uma visão geral, se inter-relacionar com outros termos do texto. Esta representação gráfica é um mapa conceitual gerado a partir das regras da ontologia que contemplam o modelo. A mídia do conhecimento no modelo são os mapas conceituais gerados. Para exemplifica-lo, três disciplinas do curso Letras/LIBRAS da UFSC foram selecionadas. Os textos brutos destas disciplinas foram marcados de acordo com as regras estipuladas. Sobre estes termos marcados, a ontologia criada foi aplicada e sobre ela, outras ontologias de domínio alimentaram os termos para conceituação e explicação dos mesmos. Com o modelo aplicado, através de verificação com especialistas entende-se que o mesmo é tido como válido e que apresenta possibilidades positivas ao fluxo de design instrucional.Abstract : The distance learning (ODL) is an expanding reality. About this evolution, appears the instructional design permeating the production teams for courses in distance education. In this thesis the aim was to propose a model based on ontology and extraction of information to support the process of instructional design in the generation of knowledge media. Therefore, we sought to create a model that would have as support domain ontologies for EAD - because all instructional material an ODL course stems from a raw text (corpus). With the intention to assist the implementation phase of the instructional designer in reading this raw text, a representation system of the content was created to project for the instructional designer the basic categories on the text. For this to happen, while the plain text is worked, the instructional designer can use an extraction tool information and, consequently, expedite his work. Importantly, the model proposed here expands and works in his totality with other ontologies and it can take others to realize a graphical representation of the corpus: it exposes existing connections between terms and how they can still, in an overview, interrelate itself with other terms of the text. This graphical representation is a conceptual map generated from the rules of the ontology that include the model. To exemplify it, three courses subjects Lestras/LIBRAS - UFSC were selected. The raw texts of these disciplines were scored according to the stipulated rules. Marked on these terms, the ontology was created and applied on it, other domain ontologies fed to the conceptualization terms and explanation thereof. With the model applied by the experts verification, it is understood that the same is considered valid and presents positive possibilities to the flow of instructional design

    Procedimentos para aplicação de mapas semânticos como estratégia para criação do conhecimento organizacional

    Get PDF
    Tese (doutorado - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia de Produção.O propósito desta pesquisa foi propor a aplicação de mapas semânticos como estratégia para a criação do conhecimento organizacional em pequenas empresas de base tecnológica. Trata-se de uma pesquisa exploratória, descritiva de cunho qualitativo, fazendo-se uso do procedimento "estudo de caso" para experimentação do modelo proposto. O campo de investigação deste estudo é uma empresa de base tecnológica, de pequeno porte, membro da Associação Catarinense de Empresas de Tecnologia - ACATE. Os dados coletados por meio de entrevistas não estruturadas, de questionários aplicados, através de contato pessoal e dos mapas semânticos individuais e coletivos foram tratados e submetidos à técnica de análise de conteúdo associada à análise de freqüência de citação. Os resultados revelaram que ao usar os mapas para ativar e registrar o conhecimento individual e coletivo pode-se obter uma série de benefícios: compartilhar conhecimentos que antes eram de domínio individual; ampliar os conhecimentos por meio de discussões tendo o mapa como guia; perceber as lacunas de conhecimentos existentes no capital intelectual da empresa. Face aos resultados, conclui-se que o uso de mapas semânticos é adequado para dar suporte ao processo de criação do conhecimento organizacional estratégico bem como para proceder à análise de informações competitivas, gerando um mapa de conhecimentos que atenda às necessidades de inteligência das pequenas empresas. Assim, propõem-se alguns requisitos básicos para sua utilização, e sugere-se, o monitoramento de informações obtido por meio de mapas semânticos, como ponto de partida para o desenvolvimento de IC em pequenas empresas

    Extrator de termos para criação de mapas conceituais

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2010.Este trabalho consiste no desenvolvimento de um método para extração de termos que podem ser utilizados para a criação de mapas conceituais. O método é fundamentado em técnicas linguísticas e estatísticas para a extração de palavras-chave que podem ser usadas para originar esses tipos de mapas. Parte do método compreende um algoritmo de mineração de texto que, a partir de um conjunto de documentos selecionados pelo usuário, é capaz de extrair termos que podem ser qualificados como conceitos. Esse algoritmo pode também obter conectores semânticos entre conceitos, formando uma proposição válida sobre o tema dos documentos cadastrados. Para aplicar as funcionalidades propostas no método, foi concebida a ferramenta MapXtractor. Esta ferramenta implementa o método de extração, permite a edição de mapas conceituais, a vinculação de objetos de aprendizagem aos conceitos e o controle de acesso aos mapas. Os resultados obtidos com a utilização desse método demonstram quantitativamente e qualitativamente a superioridade da utilização de técnicas híbridas de extração de termos em relação às técnicas estatísticas para extração de termos, quando se trata da criação de mapas conceituais.This work consists in a development of a term extraction method to create conceptual maps. This method is based in linguistic and statistics techniques to extract keywords that can be used to build conceptual maps. A part of this method is compose by a textmining algorithm which is able to extract concepts from a set of documents, selected or created by an user. This algorithm also can extract semantic connectors between two concepts becoming a valid proposition in the documents' subject . To apply the features propose on the method a tool called MapXtractor was developed. This tool implements the extraction method, allows editing concept maps and link learning objects to concepts, and the access controls to the concept maps. The results show the qualitative and quantitative superiority of hybrid techniques over statistical techniques to term extraction when applied to concept map building
    corecore