4 research outputs found

    KDC: uma abordagem baseada em conhecimento para classificação de documentos

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.Classificação de documentos fornece um meio para organizar as informações, permitindo uma melhor compreensão e interpretação dos dados. A tarefa de classificar é caracterizada pela associação de rótulos de classes a documentos com o objetivo de criar agrupamentos semânticos. O aumento exponencial no número de documentos e dados digitais demanda formas mais precisas, abrangentes e eficientes para busca e organização de informações. Nesse contexto, o aprimoramento de técnicas de classificação de documentos com o uso de informação semântica é considerado essencial. Sendo assim, este trabalho propõe uma abordagem baseada em conhecimento para a classificação de documentos. A técnica utiliza termos extraídos de documentos associando-os a conceitos de uma base de conhecimento de domínio aberto. Em seguida, os conceitos são generalizados a um nível maior de abstração. Por fim, é calculado um valor de disparidade entre os conceitos generalizados e o documento, sendo o conceito de menor disparidade considerado como rótulo de classe aplicável ao documento. A aplicação da técnica proposta oferece vantagens sobre os métodos convencionais como a ausência da necessidade de treinamento, a oportunidade de atribuir uma ou múltiplas classes a um documento e a capacidade de aplicação em diferentes temas de classificação sem a necessidade de alterar o classificador.Abstract : Document classification provides a way to organize information, providing a better way to understand available data. The classification task is characterized by the association of class labels to documents, aiming to create semantic clusters. The exponential increase in the number of documents and digital data demands for more precise, comprehensive and efficient ways to search and organize information. In this context, the improvement of document classification techniques using semantic information is considered essential. Thus, this paper proposes a knowledge-based approach for the classification of documents. The technique uses terms extracted from documents in association with concepts of an open domain knowledge base. Then, the concepts are generalized to a higher level of abstraction. Finally a disparity value between generalized concepts and the document is calculated, and the best ranked concept is then considered as a class label applicable to the document. The application of the proposed technique offers advantages over conventional methods including no need for training, the choice to assign one or multiple classes to a document and the capacity to classify over different subjects without the need to change the classifier

    Um modelo para organização de documentos no contexto da memória organizacional

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2014.Gerenciar e estruturar um conjunto de documentos em uma organização pode otimizar os processos de gestão, contribuindo para o seu desempenho e sucesso. Sabe-se que, apesar de haver iniciativas de gestão do conhecimento (GC), a quantidade de informações heterogêneas muitas vezes inviabiliza uma gestão produtiva. A memória organizacional (MO) fornece acesso, persistência e recuperação de dados. Assim, esta pesquisa se concentrou na definição da estrutura de um modelo de organização de documentos para a MO, o qual é apoiado por um método desenvolvido para a classificação dos documentos em múltiplas categorias com lógica fuzzy. Para avaliação deste modelo, considerou-se a estrutura de uma organização de tecnologia da informação (TI) com um conjunto de 17 categorias. Os resultados agregam valor para a organização porque permitem tratar um conjunto de informações espalhadas em diversos documentos, refinando o espaço de busca e recuperando a informação de interesse para os indivíduos que nela atuam. Além disso, o trabalho individual migra para um nível coletivo, porque se pode tratar informações de interesse comum aos grupos dentro da organização.Abstract : The task of managing and structuring a set of documents within an organization can optimize the management process, contributing to it's performance and success. It is well known that despite the efforts of knowledge management (KM), the amount of heterogeneous information often prevents a productive management. The organizational memory (OM) provides access, persistence and retrieval of data. Thus, this research has focused on the definition of the structure of a document organization model in the context of an organizational memory, which is supported by a methodology developed for the classification of documents into multiple categories with fuzzy logic. The structure of an information technology (IT) organization with a set of 17 categories was considered to evaluate this model. The results add value to the organization because they allow to treat a set of information spread over different documents, refining the search space and retrieving relevant information to individuals working in it. Additionally, individual work migrates to a collective level, because it can handle information of common interest to the groups within the organization
    corecore