2 research outputs found

    Características identificadoras e dificuldades na aplicação de listas para a anotação de Entidades Geográficas Mencionadas

    Get PDF
    Na anotação automática de entidades geográficas mencionadas, as listas especializadas de topónimos têm que enfrentar ambiguidades e contextos em que o valor geográfico de uma expressão não é evidente. Neste artigo, estuda-se o caso prático de um índice de topónimos utilizado para criar um corpus anotado da Peregrinação de Mendes Pinto. As dificuldades achadas servem para classificar os tipos de erros que se produzem quando o topónimo é resolvido pela simples coincidência de expressões e introduzem critérios para a identificação das entidades geográficas, uma tarefa que deve preceder e tem um impacto direto nos resultados obtidos no processo de anotação automática.In order to annotate geographical named entities, gazetteers have to face ambiguities and contexts where the geographical value of a given expression is not clear. In this paper, an index of place names is used to examine the main problems encountered in the production of an annotated corpus of Mendes Pinto’s Pilgrimage. The difficulties found serve to classify the types of errors that occur when the place name is solved by simple string match and introduce criteria for the identification of geographical entities, a task that should precede and has a direct impact on the results obtained in an automatic annotation approach

    Algumas intersecções disciplinares na recuperação da geografia da Peregrinação de Fernão Mendes Pinto

    Get PDF
    There have been different interdisciplinary approaches to recreating the routes and locations in Fernão Mendes Pinto’s travels. Until now, none has been able to provide a georeference for all the areas involved. In this article we combine techniques from Natural Language Processing (NLP) and Geographic Information Systems (GIS) to produce an index of geographically named entities. After careful comparative analysis of specialized works, mainly from the domain of history and historical geography, our index provides an exact georeference for all locations that were previously known and show no contradiction with Pinto’s description. For the rest, we build an initial model that solves a relative georeference where every single entity is assigned a geographical feature and is linked to a holonym as a part to which it belongs. The resulting taxonomy is further processed as an ontology and stored along with additional data from corpus analysis in a relational database. We illustrate methods and results with examples, describe the final products, and conclude more interdisciplinary analysis is required to further develop the relative georeferences. KEYWORDS: Fernão Mendes Pinto, georeferencing, geographical named entities, historical geography, text mining.A geografia da Peregrinação de Fernão Mendes Pinto tem sido abordada desde aproximações interdisciplinares com a intenção de reconstruir itinerários e cenários. Nenhuma obra conseguiu, de momento, referenciar toda a geografia da Peregrinação para todas as áreas. Neste artigo descreve-se mais um contributo que combina técnicas do Processamento da Linguagem Natural (PLN) com Sistemas de Informação Geográfica (SIG) para elaborar um novo índice de entidades geográficas mencionadas. A partir da análise comparada de obras especializadas, principalmente no domínio da história e da geografia histórica, o índice oferece uma georreferência exata para todas as localidades que, sendo conhecidas previamente, não apresentam contradição com a descrição dada por Pinto. Configuramos um modelo em que cada entidade é classificada segundo um tipo geográfico físico ou administrativo e ligada com um holónimo na relação Parte_de à qual pertence. A taxonomia resultante é processada numa ontologia e guardada junto de dados adicionais do corpus numa base de dados relacional. Ilustram-se os métodos e resultados com exemplos, descrevem-se os produtos finais e conclui-se ser necessária uma maior análise interdisciplinar para mais desenvolver as georreferências relativas.PALAVRAS-CHAVE: Fernão Mendes Pinto, georeferrenciamento, entidades geográficas mencionadas, geografia histórica, mineração de texto
    corecore