2,175 research outputs found

    Dicionário aberto : um recurso para processamento de linguagem natural

    Get PDF
    Este artigo apresenta o projecto Dicionário Aberto, a construção de um dicionário aberto, livre e gratuíto, para a língua portuguesa. Para ajudar no arranque optou-se pela transcrição de um dicionário em papel no domínimo público: Novo Diccionário da Língua Portuguesa, de Cândido de Figueiredo, de 1913. Apresentamos o processo usado para a transcrição bem como a metodo- logia usada para garantir um patamar de qualidade mínima da transcrição, e como o dicionário foi posteriormente convertido para um formato XML, per- mitindo uma maior facilidade de processamento a terceiros. Finalmente, são discutidos os problemas existentes no uso de um dicio- nário com quase um século, e como se pretende proceder à sua modernização (de conteúdos e de grafia), e de que forma este recurso pode ser útil para o processamento da língua portuguesa.This document presents Dicionário Aberto project which aims at the construction of an open-source and free dictionary, for the Portuguese language. To help the bootstrap process, a paper dictionary in the public domain was transcribed: Novo Diccionário da Língua Portuguesa, of Cândido de Figueiredo, from 1913

    Alguns trilhos para arqueologia documental

    Get PDF
    Mestrado em Engenharia Electrónica e TelecomunicaçõesO presente trabalho procura identificar instrumentos de processamento de linguagem natural, e a possibilidade da sua integração com o serviço de indexação da Microsoft. O processamento de linguagem natural é analisado na perspectiva da análise dos erros resultantes do OCR e na definição de um esquema de classificação de documentos. ABSTRACT: This work aims to identify natural language processing tools and evaluates its integration capabilities with Microsoft’s Indexing Service. The natural language processing faces the OCR’s resulting errors problem and the classification schema’s definition

    Processamento de linguagem natural para indexação automática semântico-ontológica

    Get PDF
    A pesquisa propõe uma arquitetura de indexação automática de documentos utilizando mecanismos de processamento de linguagem natural em nível semântico. Por meio do arranjo de ferramentas e recursos existentes, agregado ao desenvolvimento de software para integração, é construído um sistema de indexação automática que utiliza conhecimento modelado em uma ontologia para análise semântica. A aplicação da arquitetura é exemplificada e posta à prova em um conjunto de laudos periciais de crimes cibernéticos produzidos pela Perícia Criminal da Polícia Federal. Os resultados de pesquisa apontam para a melhoria que o aprofundamento à análise semântica do processamento de linguagem natural oferece para a seleção automática de descritores e, por extensão, para a recuperação da informação. Dentre as contribuições inéditas desta tese incluem-se a arquitetura de sistema de informação para indexação automática proposta, a ontologia construída para a análise semântica e as implementações em linguagem de programação Python. Por fim, o trabalho insere-se em uma área de pesquisa que tem sido cada vez mais investigada, no entanto ainda carece de resultados amadurecidos, qual seja o processamento de linguagem natural em língua portuguesa

    Processamento de linguagem natural para produtos de seguros

    Get PDF
    PLM é uma metodologia cuja existência é suportado pelo desempenho dos recursos humanos. As pessoas expressam-se da melhor maneira através da linguagem natural. Neste sentido, é necessário que o produto seja receptivo e pronto para a entrada de dados inseridos por pessoas através de linguagem natural. Esta aplicação vem da necessidade das pessoas de terem uma interação intuitiva e útil para com o sistema. Através da interpretação da linguagem natural, esta aplicação serve como ponto de entrada para o tratamento e armazenamento de dados, fornecendo no final da mesma um produto financeiro formatado de acordo com os standards da indústria. Esta aplicação é criado de modo a testar o conceito de abordagem PLM para produtos financeiros, mais especificamente, apólices de seguro.PLM is a methodology whose existence is supported by the performance of human resources. People express themselves the best way through natural language. In this sense, it is necessary that the product be receptive and ready for input data entered by people through natural language. This application comes the need for people to have an intuitive and useful to interact with the system. Through the interpretation of natural language, this application serves as an entry point for the processing and storage of data, providing end thereof a financial product formatted in accordance with industry standards. This application is created in order to test the concept of PLM approach to financial products, more specifically insurance policies

    Interface em Processamento de Linguagem Natural para Urologia

    Get PDF
    O processamento de linguagem natural é composto por métodoscomputacionais que têm a função de analisar um texto e a partir disso gerarrespostas compreensíveis pelo ser humano. Este artigo refere-se à utilizaçãodesta técnica de inteligência computacional no desenvolvimento do protótipode um sistema com interface em linguagem natural, denominado de Hades,onde o médico urologista pode consultar informações do paciente usufruindoda própria linguagem utilizada em um diálogo

    ESTUDOS DE TÉCNICAS PARA PROCESSAMENTO DE LINGUAGEM NATURAL

    Get PDF
    Processamento de Linguagem Natural (do inglês Natural Language Processing - NLP)é uma área da inteligência artificial que tem se ocupado com o desenvolvimento demodelos computacionais para a realização de tarefas que dependem de informaçõesexpressas em língua natural

    Interface em Processamento de Linguagem Natural para Urologia

    Get PDF
    O processamento de linguagem natural é composto por métodoscomputacionais que têm a função de analisar um texto e a partir disso gerarrespostas compreensíveis pelo ser humano. Este artigo refere-se à utilizaçãodesta técnica de inteligência computacional no desenvolvimento do protótipode um sistema com interface em linguagem natural, denominado de Hades,onde o médico urologista pode consultar informações do paciente usufruindoda própria linguagem utilizada em um diálogo

    Classificação de documentos com processamento de linguagem natural

    Get PDF
    A quantidade de informação tem vindo a crescer ao longo dos anos, e a sua sobrecarga é hoje, um dos grandes problemas que as empresas e instituições enfrentam. A classificação dos documentos de forma automática surge então como uma necessidade, visto um sistema automático ser capaz de classificar milhares de documentos em apenas alguns segundos, o que seria impraticável de ser realizado por um ser humano. O maior desafio nesta área é obter os melhores resultados, maior eficiência computacional e maior capacidade de auto-aprendizagem, através nomeadamente da implementação de técnicas para a melhor seleção de features. Este trabalho analisa e compara técnicas de classificação com processamento de linguagem natural, através da linguagem Python e com apoio da biblioteca para processamento de linguagem natural Natural Language Toolkit (NLTK). Neste projeto, foram implementados algoritmos para classificação de documentos, com técnicas de Text Mining e NLP, utilizando classificadores como Redes Neuronais, SVM’s e Redes Bayesianas. Foram avaliados em vários casos de estudo e os resultados obtidos nos diferentes estudos atingiram valores médios acima de 90% de accuracy. Um dos principais objetivos deste projeto é aplicar os classificadores implementados na classificação de literatura na área das proteínas. Como resultado deste projeto, foi também implementada uma aplicação web para classificação de documentos, disponibilizando os algoritmos implementados

    Classificação de normas do Banco Central do Brasil aplicadas às instituições de pagamentos com aprendizado de máquina e processamento de linguagem natural

    Get PDF
    Orientador: Prof. Dr. Luciano Heitor Gallegos MarinTrabalho de Conclusão de Curso (graduação) - Universidade Federal do Paraná, Setor de Ciências Sociais Aplicadas, Curso de Gestão da Informação.Inclui referênciasResumo : O objetivo deste trabalho é utilizar métodos de aprendizado de máquina e processamento de linguagem natural para classificar resoluções e instruções normativas do Banco Central do Brasil em relação às Instituições de Pagamentos. Pretende avaliar a eficácia dos algoritmos utilizados e o risco da sua aplicação. Discorre sobre o contexto das fintechs e instituições de pagamentos, bem como as regulamentações necessárias em conjunto ao Compliance, abordando o cenário regulatório dessas instituições no Brasil. Explica o aprendizado de máquina e o processamento de linguagem natural, destacando suas aplicações na classificação de textos ou documentos. São apresentadas técnicas de limpeza e pré-processamento das resoluções e instruções normativa do Banco Central do Brasil, assim como a descrição detalhada do tratamento dos documentos e a aplicação de algoritmos para a classificação dos mesmos. Verifica o desempenho de diversas técnicas para verificar a mais efetiva para a classificação de resoluções e instruções. Define como os resultados podem auxiliar na aplicação de Aprendizado de Máquina e Processamento de Linguagem Natural nestas resoluções e normas
    corecore