11 research outputs found

    Desenvolvimento e avaliação de um modelo NER no domínio da análise cultural e do turismo

    Get PDF
     O Reconhecimento de Entidades Mencionadas (NER) é uma tarefa essencial de extracção de informação em que as entidades de um texto são identificadas e classificadas. Um dos principais desafios enfrentados pelos sistemas NER é a dificuldade de generalização do aprendido para outros tipos de corpora diferentes dos utilizados durante o treino. Este problema é acentuado pelo facto de a maioria dos corpora de treino utilizados serem de natureza jornalística e, portanto, precisarem de ser adaptados a outros géneros e domínios. Neste artigo, utilizamos um corpus espanhol composto por entrevistas a visitantes da cidade de Santiago de Compostela e anotado com entidades mencionadas, para a avaliação e treino de sistemas NER adaptados ao domínio da cultura e do turismo. Apresentamos uma comparação das diferentes abordagens aplicadas, desde algoritmos clássicos de aprendizagem automática ao afinamento de vários modelos de Transformers. Os resultados obtidos superam significativamente o baseline, representado aqui pelos toolkits Stanza, spaCy e Flair, embora os testes preliminares com entidades não observadas durante o treino sugiram a necessidade de avaliações adicionais da sua capacidade de generalização e o uso de um método de segmentação adversarial no corpus

    Análise de redes sociais como apoio na formulação e avaliação de políticas públicas de turismo: O caso do Caminho de Santiago

    Get PDF
    Sustainable public tourism policy management can benefit from learning about the perceptions of visitors and residents. While the views of the former can help to better satisfy their preferences, the latter can assist in identifying threats to the sustainability of tourismactivities, and satisfaction with how tourism is managed. Information shared on social media has proved a useful resource for the study of perceptions, but the approach needs to be adapted in order to deal with the specific features of tourism. The aim of this article is toassess the use of social media in the design and assessment of public tourism policy from the perspective of sustainability and in relation to the specific case of the Way of St James. The artificial intelligence algorithms used show a clearly positive assessment of the tourist experience at present, and identify a set of possible measures to improve the sustainability of the underlying policies: 1) preserve and promote natural and cultural heritage; 2) facilitate integration of visitors with local communities, and 3) improve supply in sectors such as restaurants, logistics and safety. The results of the study have been shared through the the Social Data Lab repository at Harvard University Dataverse in order to facilitate the verification and reuse of the study data by the scientific community at large.La gestión de las políticas públicas de turismo sostenible puede beneficiarse del conocimiento de las percepciones tanto de los visitantes como de los residentes. Si las de los primeros permiten adaptar mejor la oferta turística a sus demandas, las percepciones de los residentes ayudan a identificar posibles amenazas tanto para la sostenibilidad de la actividad turística como para la valoración política de sus gestores. La información compartida en las redes sociales ha demostrado su utilidad para el análisis de las percepciones, pero es necesario adaptar la metodología a las características específicas del turismo. En este trabajo se evalúa la utilidad de la información compartida en redes sociales para el diseño y evaluación de políticas públicas turísticas desde la perspectiva de la sostenibilidad para el caso del Camino de Santiago. Utilizando algoritmos de inteligencia artificial, encontramos una valoración claramente positiva de la experiencia actual, e identificamos acciones capaces de mejorar su sostenibilidad: 1) la preservación y promoción del patrimonio natural y cultural, 2) la integración de los visitantes con las comunidades locales, y 3) la mejora de la oferta en áreas como la restauración, la logística o la seguridad. Para facilitar la prueba de nuestro análisis, así como para permitir la reutilización de nuestros datos por parte de la comunidad científica, compartimos los resultados a través del repositorio del Social Data Lab en el Dataverse de la Universidad de Harvard.A xestión das políticas públicas de turismo sostible pode beneficiarse do coñecemento das percepcións tanto dos visitantes como dos residentes. Se as dos primeiros permiten adaptar mellor a oferta turística ás súas demandas, as percepcións dos residentes axudan a identificar posibles ameazas tanto para a sustentabilidade da actividade turística como para a valoración política dos seus xestores. A información compartida nas redes sociais ten demostrado a súa utilidade para a análise das percepcións, pero é necesario adaptar a metodoloxía ás características específicas do turismo. Neste traballo avalíase a utilidade da información compartida en redes sociais para o deseño e avaliación de políticas públicas turísticas desde a perspectiva da sustentabilidade para o caso do Camiño de Santiago. Utilizando algoritmos de intelixencia artificial, atopamos unha valoración claramente positiva da experiencia actual, e identificamos accións capaces de mellorar a súa sustentabilidade: 1) a preservación e promoción do patrimonio natural e cultural, 2) a integración dos visitantes coas comunidades locais, e 3) a mellora da oferta en áreas como a restauración, a loxística ou a seguridade. Para facilitar a proba da nosa análise, así como para permitir a reutilización dos nosos datos por parte da comunidade científica, compartimos os resultados a través do repositorio do Social Data Lab no Dataverse da Universidade de Harvard.La gestione delle politiche pubbliche per il turismo sostenibile può trarre vantaggio dalla conoscenza delle percezioni dei visitatori e dei residenti. Se quelle dei primi permettono di adattare meglio l'offerta turistica alle loro richieste, le percezioni dei residenti aiutano a identificare le possibili minacce sia per la sostenibilità dell'attività turistica sia per la valutazione politica dei suoi gestori. Le informazioni condivise sui social network hanno dimostrato la loro utilità per l'analisi delle percezioni, ma la metodologia deve essere adattata alle caratteristiche specifiche del turismo. In questo articolo valutiamo l'utilità delle informazioni condivise sui social network per la progettazione e la valutazione delle politiche pubbliche del turismo dal punto di vista della sostenibilità per il caso del Cammino di Santiago. Utilizzando algoritmi di intelligenza artificiale, abbiamo riscontrato una valutazione chiaramente positiva dell'esperienza attuale e identificato le azioni in grado di migliorarne la sostenibilità: 1) la conservazione e la promozione del patrimonio naturale e culturale, 2) l'integrazione dei visitatori con le comunità locali e 3) il miglioramento dell'offerta in aree quali la ristorazione, la logistica o la sicurezza. Per facilitare la dimostrazione della nostra analisi e per consentire il riutilizzo dei nostri dati da parte della comunità scientifica, condividiamo i risultati attraverso il repository del Social Data Lab sul Dataverse dell'Università di Harvard.A gestão de políticas públicas turísticas sustentáveis pode beneficiar-se do conhecimento sobre as perceções tanto de visitantes como de residentes. Se as dos primeiros permitem adaptar melhor a oferta turística às suas demandas, as perceções dos residentes ajudam a identificar possíveis ameaças tanto para a sustentabilidade da atividade turística, como para a avaliação política dos seus gestores. A informação partilhada nas redes sociais demonstrou a sua utilidade para a análise de perceções, pero a metodologia precisa ser adaptada às caraterísticas específicas do turismo. Neste artigo avaliamos a utilidade da informação partilhada em redes sociais para o desenho e avaliação das políticas públicas turísticas desde a perspetiva da sustentabilidade para o caso do Caminho de Santiago. Usando algoritmos de inteligência artificial, constatamos uma valoração claramente positiva da experiência atual, e identificamos ações capazes de melhorar a sua sustentabilidade: 1) a preservação e promoção do património natural e cultural, 2) a integração dos visitantes com as comunidades locais, e 3) a melhora da oferta em áreas como a restauração, a logística ou a seguridade. Para facilitar a comprovação da nossa análise, assim como para permitir a reutilização dos nossos dados pela comunidade científica, compartilhamos os resultados através do repositório do Social Data Lab no Dataverse da Universidade de Harvard

    Visitar, comerciar e habitar a cidade : desenvolvemento do proxecto expositivo e participación social en Santiago de Compostela

    Get PDF
    A obra quer dar conta das três exposições temáticas que, inscritas no projeto expositivo geral A Cidade, o Caminho e Nós, serviram para transmitir à cidadania de Compostela (entre outubro de 2019 e janeiro de 2020) os principais resultados com relação às diversas visões de Santiago e às diferentes imagens e práticas de visitantes, habitantes e comerciantes de Compostela. A partir das informações declaradas por mais de 3.700 pessoas que, respondendo a diversas entrevistas, colaboraram no desenvolvimento desta investigação realizada dentro da Rede Galabra, apresentam-se aqui elementos que ajudam a identificar os impactos – quer positivos, quer negativos– dessas imagens e práticas na comunidade local compostelana. Assim, colocam-se questões de relevância para formar opinião informada sobre diversos aspetos da transformação experimentada por Santiago de Compostela nos tempos mais recentes… e para se pensar a cidade e a comunidade que queremos para o futuroO presente volume faz parte do projeto D “Narrativas, usos e consumos de visitantes como aliados o ameaças para o bem-estar da comunidade local” Ref: FFI2017-88196-R, parcialmente subsidiado polo Ministerio de Ciencia, Innovación e Universidades e os Fundos FEDE

    El tratamiento de la polisemia en la extracción de léxicos bilingües a partir de corpora paralelos

    Get PDF
    Este artículo propone un método de extracción de equivalentes léxicos de traducción a partir de corpora paralelos alineados a niveles superiores a la oración y etiquetados morfosintácticamente. La estrategia que seguiremos toma en cuenta el efecto discriminante y desambiguador que el contexto local ejerce sobre un elemento léxico. Dada una palabra de la lengua fuente y un tipo de contexto particular, el método propuesto aprende la traducción de la palabra en ese tipo de contexto.The paper proposes a method to extract translation equivalents from parallel corpora which were POS tagged and aligned using very large segments. The strategy we use takes into account the ability of contexts to select senses of words. Given a word of the source language and a particular type of context, we learn its word translation within an equivalent context.Este trabajo ha sido subvencionado por el Ministerio de Educación y Ciencia a cargo del proyecto Gari-Coter, ref: HUM2004-05658-D02-02

    OpenCorpus: a Replicable Compilation of Plain Text Corpora for Scientific Research

    No full text
    openCorpus Data and replication bundl

    Un supresor de ambigüedades léxicas mediante métodos estadísticos

    No full text
    Presentamos el trabajo realizado para conseguir un sistema que, integrado en el proyecto GALENA (Generador de Analizadores de LEnguajes NAturales), logre eliminar, de forma estadística, las ambigüedades que provocan las palabras al ser tratadas por el módulo de análisis léxico. El análisis léxico proporciona a las palabras unas etiquetas, es decir, descripciones que contienen toda la información (tipológica, morfológica...) necesaria para caracterizarlas en el conjunto del léxico de la lengua. A cada palabra aislada, fuera de contexto, pueden corresponderle varias etiquetas. Esta situación imposibilita el análisis sintáctico de los textos. Surge, por tanto, la necesidad de eliminar las ambigüedades en el proceso de etiquetación. El objetivo del presente trabajo es proveer de una única etiqueta a cada palabra, asignando la que en cada caso sea más probable según la historia del texto en estudio. Para ello, es necesario un análisis estadístico de textos del mismo estilo literario que el que va a ser tratado, y la aplicación de ese estudio al texto en cuestión. El supresor de ambigüedades que proponemos permite la selección, por parte del usuario, de la información léxica a utilizar en la desambiguación, y ofrece funcionalidades complementarias para el tratamiento de las matrices de aprendizaje.Este trabajo está parcialmente financiado por los proyectos XUGA20103B95 y XUGA10505B96 de la Xunta de Galicia

    Un supresor de ambigüedades léxicas mediante métodos estadísticos

    No full text
    Presentamos el trabajo realizado para conseguir un sistema que, integrado en el proyecto GALENA (Generador de Analizadores de LEnguajes NAturales), logre eliminar, de forma estadística, las ambigüedades que provocan las palabras al ser tratadas por el módulo de análisis léxico. El análisis léxico proporciona a las palabras unas etiquetas, es decir, descripciones que contienen toda la información (tipológica, morfológica...) necesaria para caracterizarlas en el conjunto del léxico de la lengua. A cada palabra aislada, fuera de contexto, pueden corresponderle varias etiquetas. Esta situación imposibilita el análisis sintáctico de los textos. Surge, por tanto, la necesidad de eliminar las ambigüedades en el proceso de etiquetación. El objetivo del presente trabajo es proveer de una única etiqueta a cada palabra, asignando la que en cada caso sea más probable según la historia del texto en estudio. Para ello, es necesario un análisis estadístico de textos del mismo estilo literario que el que va a ser tratado, y la aplicación de ese estudio al texto en cuestión. El supresor de ambigüedades que proponemos permite la selección, por parte del usuario, de la información léxica a utilizar en la desambiguación, y ofrece funcionalidades complementarias para el tratamiento de las matrices de aprendizaje

    AVALON, una gramática formal basada en corpus

    No full text
    En esta exposición se presenta el trabajo que se está llevando a cabo en la Universidad de Santiago de Compostela para desarrollar una gramática formal basada en corpus. El que presentamos aquí es un trabajo asociado al proyecto DoRo, aunque supera ampliamente sus requerimientos y constituye un objetivo independiente en sí mismo. Pretendemos describir el corpus de datos, la concepción general de la gramática en sí misma y, sobre todo, cómo ésta se sirve de aquellos, con qué fines y, en la medida de lo posible en el estado actual del trabajo, con qué ventajas

    El proyecto Gari-Coter en el seno del proyecto RICOTERM2

    Get PDF
    Descripción del proyecto Gari-Coter para la elaboración de los recursos lingüísticos en gallego necesarios para un re-elaborador de consultas multilingüe.Description of the Gari-Coter project for the development of the necessary linguistic resources in Galician for a multilingual query re-elaborator
    corecore