17,591 research outputs found

    Towards Syntactic Iberian Polarity Classification

    Full text link
    Lexicon-based methods using syntactic rules for polarity classification rely on parsers that are dependent on the language and on treebank guidelines. Thus, rules are also dependent and require adaptation, especially in multilingual scenarios. We tackle this challenge in the context of the Iberian Peninsula, releasing the first symbolic syntax-based Iberian system with rules shared across five official languages: Basque, Catalan, Galician, Portuguese and Spanish. The model is made available.Comment: 7 pages, 5 tables. Contribution to the 8th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA-2017) at EMNLP 201

    AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages

    Full text link
    Africa is home to over 2000 languages from over six language families and has the highest linguistic diversity among all continents. This includes 75 languages with at least one million speakers each. Yet, there is little NLP research conducted on African languages. Crucial in enabling such research is the availability of high-quality annotated datasets. In this paper, we introduce AfriSenti, which consists of 14 sentiment datasets of 110,000+ tweets in 14 African languages (Amharic, Algerian Arabic, Hausa, Igbo, Kinyarwanda, Moroccan Arabic, Mozambican Portuguese, Nigerian Pidgin, Oromo, Swahili, Tigrinya, Twi, Xitsonga, and Yor\`ub\'a) from four language families annotated by native speakers. The data is used in SemEval 2023 Task 12, the first Afro-centric SemEval shared task. We describe the data collection methodology, annotation process, and related challenges when curating each of the datasets. We conduct experiments with different sentiment classification baselines and discuss their usefulness. We hope AfriSenti enables new work on under-represented languages. The dataset is available at https://github.com/afrisenti-semeval/afrisent-semeval-2023 and can also be loaded as a huggingface datasets (https://huggingface.co/datasets/shmuhammad/AfriSenti).Comment: 15 pages, 6 Figures, 9 Table

    Hotel online reviews: different languages, different opinions

    Get PDF
    Online reviews are one of the main influencers of hotel purchase decisions. This study performs an analysis of reviews extracted from well-known online review sources in combination with hotel sales data and concludes that ratings differ according to the language of reviews. Data science tools have been applied to English, Spanish, and Portuguese reviews, revealing that reviews written in English achieve higher ratings when compared with Spanish or Portuguese reviews. A new visualization method is proposed to quickly depict the sentiment of main topics mentioned in reviews, clearly revealing that not all customers are influenced by reviews in the same way or look for the same things in a hotel. This study has great implications for online reviews research and for hotel management as it clearly shows that language can be used to identify preferences of guests from different origins and because it gives hoteliers more information on how to provide a better service according to guests’ cultural background.info:eu-repo/semantics/acceptedVersio

    Different Lexicon-Based Approaches to Emotion Identification in Portuguese Tweets (Short Paper)

    Get PDF
    This paper presents the existing literature on the identification of emotions and describes various lexica-based approaches and translation strategies to identify emotions in Portuguese tweets. A dataset of tweets was manually annotated to evaluate our classifier and also to assess the difficulty of the task. A lexicon-based approach was used in order to classify the presence or absence of eight different emotions in a tweet. Different strategies have been applied to refine and improve an existing and widely used lexicon, by means of automatic machine translation and aligned word embeddings. We tested six different classification approaches, exploring different ways of directly applying resources available for English by means of different translation strategies. The achieved results suggest that a better performance can be obtained both by improving a lexicon and by directly translating tweets into English and then applying an existing English lexicon

    Online reviews: a pathway to hotels improvment

    Get PDF
    Objetivos: O propósito deste estudo é verificar como avaliações sobre hotéis postadas em plataformas de avaliação online podem ser uma ferramenta útil para melhorar o desempenho das empresas hoteleiras. Tal finalidade originou as seguintes questões: 1) De que forma a análise das avaliações online podem ser úteis para os gestores, profissionais de marketing, especialistas e técnicos da indústria hoteleira? 2) Como as avaliações online são normalmente coletadas, filtradas e analisadas por académicos e pesquisadores? A fim de alcançar este objetivo e responder às questões de pesquisa, este estudo é conduzido em duas etapas. Primeiramente é realizada uma revisão sistemática da literatura com vista a identificar uma ampla variedade de contribuições, obtidas através das opiniões de usuários e capazes de auxiliar a decisão de gestores de unidades hoteleiras, independentemente de sua categoria, localização ou tamanho. Uma vez identificados os procedimentos mais relevantes na extração e análise de grandes quantidades de dados, dá-se início a uma nova etapa. O segundo estágio deste estudo consiste em verificar como diferentes mercados Europeus avaliam uma amostra de hotéis Portugueses localizados no Algarve, através da análise de avaliações textuais realizadas na internet. Tal estudo se deve à popularidade e importância da região como destino turístico Europeu. Ao fazê-lo, pretende-se identificar se existem semelhanças entre os fatores de satisfação e insatisfação apresentados por turistas residentes do Reino Unido, França e Portugal, que pernoitam na região. Metodologia: Um primeiro estudo de revisão sistemática da literatura baseado em investigações anteriores, tais como as de Kizildag, Altin, Ozdemir, and Demirer (2017) e de Le, Scott and Lohmann (2019) é conduzid0, com o objetivo de identificar publicações científicas que exploram o uso de avaliações online como um instrumento para a indústria hoteleira e prover perceções significativas para profissionais da indústria hoteleira. Para tanto, são analisadas revistas com arbitragem científica em língua inglesa, espanhola e portuguesa, publicadas mundialmente entre janeiro de 2008 e janeiro de 2020, contendo as palavras-chave: avaliações online, melhoria dos hotéis, desempenho hoteleiro e desenvolvimento de hotéis, em onze diferentes bases de dados. O processo de revisão sistemática de literatura é então dividido em cinco estágios. Primeiramente são definidas as perguntas de pesquisa. De seguida, é formulado o protocolo de revisão. Posteriormente, dá-se início a condução da pesquisa de literatura, onde os documentos passam por um extenso processo de seleção e análise. O quarto estágio consiste na coleta de informações-chave de cada um dos artigos selecionados e, finalmente, no último estágio, é realizada a análise do conteúdo, assim como a apresentação dos resultados, discussão e conclusão. A partir dos resultados obtidos através da revisão sistemática de literatura, um estudo de caso envolvendo segmentação de mercado, análise de frequência e análise de sentimento é conduzido. Por sua vez, a segunda etapa deste trabalho analisa as avaliações online referentes às unidades hoteleiras de 1 a 5 estrelas localizadas no Algarve, registadas no Registo Nacional dos Empreendimentos Turísticos (RNET), e com dados elegíveis para extração junto a uma das mais populares plataformas de avaliações online de produtos turísticos da atualidade, o site TripAdvisor.com. Foram selecionadas avaliações textuais em língua inglesa, francesa e portuguesa, redigidas por turistas residentes do Reino Unido, França e Portugal no período compreendido entre janeiro e dezembro de 2019. Após sua extração, os dados passam por um processo de refinamento onde são segmentados de acordo com o idioma e país de residência, além de serem revisadas ortograficamente para minimização de vieses durante sua análise. Após refinados, os dados extraídos são submetidos a análises de frequência e de sentimento por meio de um software apropriado. Os resultados obtidos são então expostos, discutidos e novas implicações académicas e práticas são apresentadas. Resultados: Após a condução do primeiro estudo, o referente à revisão sistemática de literatura, 59 artigos considerados relevantes para obtenção de respostas aos questionamentos propostos por este estudo foram identificados e analisados em sua totalidade. Tal verificação resultou na revelação de diversas abordagens capazes de demonstrar como as avaliações online apoiam o desenvolvimento e aperfeiçoamento de negócios no sector hoteleiro. Os resultados obtidos demonstram que os comentários extraídos das plataformas de avaliação online mais populares submetidos a técnicas de mineração de dados e metodologias tais como análise de sentimento, agrupamento de dados e análise de regressão, têm permitido que académicos e pesquisadores compreendam quais atributos tangíveis e intangíveis influenciam a satisfação dos hóspedes de um modo geral, além de segmentar mercados, identificar tendências de mercado, bem como oportunidades e mudança de comportamento dos consumidores. Embora um número significativo de implicações práticas tenha sido revelado, lacunas de investigação são identificadas e recomendações para futuros estudos são fornecidas. o segundo estudo conduzido com base na análise de frequência, bem como na análise de sentimento de 8.596 avaliações online, extraídas do site TripAdvisor, sobre 161 unidades hoteleiras localizadas na região do Algarve, em Portugal permitiu demonstrar que, não somente as taxas de satisfação e insatisfação com relação aos atributos dos hotéis diferem de acordo com cada mercado, mas também que turistas de diferentes origens geográficas e contextos culturais, enfatizam esses atributos distintivamente. Ademais, tais revelações sugerem o uso de análises e técnicas de mineração de dados como uma importante ferramenta para compreender a perceção dos hóspedes com relação aos atributos dos hotéis. Desta forma, gestores podem investir seu orçamento de forma mais precisa com vistas à melhoria dos serviços e produtos oferecidos aos seus clientes. Implicações da investigação: Para além de contribuir para a literatura existente, aumentando a pesquisa atual sobre o uso de avaliações online e técnicas de mineração de dados, os resultados deste estudo também fornecem aos profissionais da indústria hoteleira informações sobre como tirar proveito destas avaliações, além de identificar oportunidades de melhoria com base na análise de avaliações textuais de três mercados Europeus distintos numa mesma plataforma. As diversas formas apresentadas por este estudo sobre como as avaliações online podem ser analisadas, proporcionam aos gestores e profissionais do setor hoteleiro ideias de como é possível obter resultados precisos e atempados sobre a perceção de seus hóspedes. Além disso, algumas dessas aplicações podem ser menos dispendiosas quando comparadas com abordagens mais tradicionais, como por exemplo, a aplicação de questionários de satisfação junto aos clientes. Originalidade: Embora vários estudos se centrem no desenvolvimento de negócios dos hotéis usando avaliações online, apenas alguns estudos reuniram esses documentos para verificar as suas aplicações e implicações ao nível da gestão. Outrossim, ainda que um número significativo de artigos sobre segmentação de marketing através de técnicas de mineração de dados tenha sido publicado, este estudo analisa a satisfação geral de hóspedes pertencentes a três relevantes mercados Europeus para o Algarve e sugere implicações práticas atualizadas para académicos e profissionais do setor hoteleiro. Desta forma, este trabalho vem preencher essas lacunas de pesquisa.Purpose: The purpose of this study is to verify how online reviews can become a useful tool to improve the performance of hotel businesses. Therefore, this study is performed in two stages. Firstly, a systematic literature review is conducted to identify a variety of general contributions that the analysis of online reviews can bring to hoteliers. Posteriorly, through the analysis of online reviews, this study verifies how distinct European markets evaluate a sample of hotels located in the Algarve and checks if satisfaction and dissatisfaction towards hotel attributes are similar among them. Methodology: Two different methodologies are approached during this work. First, the systematic literature review analyses refereed journals containing the keywords: online reviews, hotel improvement, hotel performance and hotel development, published between January 2008 and January 2020. Afterwards, this study analyses online reviews of hotel units located in the Algarve, written in English, French as well as Portuguese languages and posted on TripAdvisor by British, French and Portuguese residents from January 2019 to December 2019. Findings: After examining 59 relevant papers, a range of approaches on how online reviews support hotel business development are uncovered. Furthermore, the analysis of 8,596 online reviews evidences that satisfaction and dissatisfaction rates towards hotel attributes differ according to the geographic distance and cultural background. Besides contributing to the existing literature by extending the current research on the use of online reviews, results obtained from both stages provide hoteliers with insights to make better use of online reviews. Originality: Although several studies approach hotel business development using online reviews, only a few studies have gathered these papers to verify their managerial implications. Additionally, this paper analyses customer satisfaction of relevant tourist markets and suggests up-to-date practical implications for hoteliers, apart from contributing to extending the research on this field

    Sentiment Analysis Across Multiple African Languages: A Current Benchmark

    Full text link
    Sentiment analysis is a fundamental and valuable task in NLP. However, due to limitations in data and technological availability, research into sentiment analysis of African languages has been fragmented and lacking. With the recent release of the AfriSenti-SemEval Shared Task 12, hosted as a part of The 17th International Workshop on Semantic Evaluation, an annotated sentiment analysis of 14 African languages was made available. We benchmarked and compared current state-of-art transformer models across 12 languages and compared the performance of training one-model-per-language versus single-model-all-languages. We also evaluated the performance of standard multilingual models and their ability to learn and transfer cross-lingual representation from non-African to African languages. Our results show that despite work in low resource modeling, more data still produces better models on a per-language basis. Models explicitly developed for African languages outperform other models on all tasks. Additionally, no one-model-fits-all solution exists for a per-language evaluation of the models evaluated. Moreover, for some languages with a smaller sample size, a larger multilingual model may perform better than a dedicated per-language model for sentiment classification.Comment: Accepted to be published as part of SIAIA @ AAAI 202
    corecore