17,591 research outputs found
Towards Syntactic Iberian Polarity Classification
Lexicon-based methods using syntactic rules for polarity classification rely
on parsers that are dependent on the language and on treebank guidelines. Thus,
rules are also dependent and require adaptation, especially in multilingual
scenarios. We tackle this challenge in the context of the Iberian Peninsula,
releasing the first symbolic syntax-based Iberian system with rules shared
across five official languages: Basque, Catalan, Galician, Portuguese and
Spanish. The model is made available.Comment: 7 pages, 5 tables. Contribution to the 8th Workshop on Computational
Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA-2017)
at EMNLP 201
AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages
Africa is home to over 2000 languages from over six language families and has
the highest linguistic diversity among all continents. This includes 75
languages with at least one million speakers each. Yet, there is little NLP
research conducted on African languages. Crucial in enabling such research is
the availability of high-quality annotated datasets. In this paper, we
introduce AfriSenti, which consists of 14 sentiment datasets of 110,000+ tweets
in 14 African languages (Amharic, Algerian Arabic, Hausa, Igbo, Kinyarwanda,
Moroccan Arabic, Mozambican Portuguese, Nigerian Pidgin, Oromo, Swahili,
Tigrinya, Twi, Xitsonga, and Yor\`ub\'a) from four language families annotated
by native speakers. The data is used in SemEval 2023 Task 12, the first
Afro-centric SemEval shared task. We describe the data collection methodology,
annotation process, and related challenges when curating each of the datasets.
We conduct experiments with different sentiment classification baselines and
discuss their usefulness. We hope AfriSenti enables new work on
under-represented languages. The dataset is available at
https://github.com/afrisenti-semeval/afrisent-semeval-2023 and can also be
loaded as a huggingface datasets
(https://huggingface.co/datasets/shmuhammad/AfriSenti).Comment: 15 pages, 6 Figures, 9 Table
Hotel online reviews: different languages, different opinions
Online reviews are one of the main influencers of hotel purchase decisions. This study performs an analysis of reviews extracted from well-known online review sources in combination with hotel sales data and concludes that ratings differ according to the language of reviews. Data science tools have been applied to English, Spanish, and Portuguese reviews, revealing that reviews written in English achieve higher ratings when compared with Spanish or Portuguese reviews. A new visualization method is proposed to quickly depict the sentiment of main topics mentioned in reviews, clearly revealing that not all customers are influenced by reviews in the same way or look for the same things in a hotel. This study has great implications for online reviews research and for hotel management as it clearly shows that language can be used to identify preferences of guests from different origins and because it gives hoteliers more information on how to provide a better service according to guests’ cultural background.info:eu-repo/semantics/acceptedVersio
Different Lexicon-Based Approaches to Emotion Identification in Portuguese Tweets (Short Paper)
This paper presents the existing literature on the identification of emotions and describes various lexica-based approaches and translation strategies to identify emotions in Portuguese tweets. A dataset of tweets was manually annotated to evaluate our classifier and also to assess the difficulty of the task. A lexicon-based approach was used in order to classify the presence or absence of eight different emotions in a tweet. Different strategies have been applied to refine and improve an existing and widely used lexicon, by means of automatic machine translation and aligned word embeddings. We tested six different classification approaches, exploring different ways of directly applying resources available for English by means of different translation strategies. The achieved results suggest that a better performance can be obtained both by improving a lexicon and by directly translating tweets into English and then applying an existing English lexicon
Online reviews: a pathway to hotels improvment
Objetivos: O propósito deste estudo é verificar como avaliações sobre hotéis postadas em
plataformas de avaliação online podem ser uma ferramenta útil para melhorar o
desempenho das empresas hoteleiras. Tal finalidade originou as seguintes questões: 1) De
que forma a análise das avaliações online podem ser úteis para os gestores, profissionais
de marketing, especialistas e técnicos da indústria hoteleira? 2) Como as avaliações online
são normalmente coletadas, filtradas e analisadas por académicos e pesquisadores? A fim
de alcançar este objetivo e responder às questões de pesquisa, este estudo é conduzido
em duas etapas. Primeiramente é realizada uma revisão sistemática da literatura com vista
a identificar uma ampla variedade de contribuições, obtidas através das opiniões de
usuários e capazes de auxiliar a decisão de gestores de unidades hoteleiras,
independentemente de sua categoria, localização ou tamanho. Uma vez identificados os
procedimentos mais relevantes na extração e análise de grandes quantidades de dados,
dá-se início a uma nova etapa. O segundo estágio deste estudo consiste em verificar como
diferentes mercados Europeus avaliam uma amostra de hotéis Portugueses localizados no
Algarve, através da análise de avaliações textuais realizadas na internet. Tal estudo se deve
à popularidade e importância da região como destino turístico Europeu. Ao fazê-lo,
pretende-se identificar se existem semelhanças entre os fatores de satisfação e
insatisfação apresentados por turistas residentes do Reino Unido, França e Portugal, que
pernoitam na região.
Metodologia: Um primeiro estudo de revisão sistemática da literatura baseado em
investigações anteriores, tais como as de Kizildag, Altin, Ozdemir, and Demirer (2017) e de
Le, Scott and Lohmann (2019) é conduzid0, com o objetivo de identificar publicações
científicas que exploram o uso de avaliações online como um instrumento para a indústria
hoteleira e prover perceções significativas para profissionais da indústria hoteleira. Para
tanto, são analisadas revistas com arbitragem científica em língua inglesa, espanhola e
portuguesa, publicadas mundialmente entre janeiro de 2008 e janeiro de 2020, contendo
as palavras-chave: avaliações online, melhoria dos hotéis, desempenho hoteleiro e
desenvolvimento de hotéis, em onze diferentes bases de dados. O processo de revisão
sistemática de literatura é então dividido em cinco estágios. Primeiramente são definidas as perguntas de pesquisa. De seguida, é formulado o protocolo de revisão.
Posteriormente, dá-se início a condução da pesquisa de literatura, onde os documentos
passam por um extenso processo de seleção e análise. O quarto estágio consiste na coleta
de informações-chave de cada um dos artigos selecionados e, finalmente, no último
estágio, é realizada a análise do conteúdo, assim como a apresentação dos resultados,
discussão e conclusão. A partir dos resultados obtidos através da revisão sistemática de
literatura, um estudo de caso envolvendo segmentação de mercado, análise de frequência
e análise de sentimento é conduzido. Por sua vez, a segunda etapa deste trabalho analisa
as avaliações online referentes às unidades hoteleiras de 1 a 5 estrelas localizadas no
Algarve, registadas no Registo Nacional dos Empreendimentos Turísticos (RNET), e com
dados elegíveis para extração junto a uma das mais populares plataformas de avaliações
online de produtos turísticos da atualidade, o site TripAdvisor.com. Foram selecionadas
avaliações textuais em língua inglesa, francesa e portuguesa, redigidas por turistas
residentes do Reino Unido, França e Portugal no período compreendido entre janeiro e
dezembro de 2019. Após sua extração, os dados passam por um processo de refinamento
onde são segmentados de acordo com o idioma e país de residência, além de serem
revisadas ortograficamente para minimização de vieses durante sua análise. Após
refinados, os dados extraídos são submetidos a análises de frequência e de sentimento
por meio de um software apropriado. Os resultados obtidos são então expostos,
discutidos e novas implicações académicas e práticas são apresentadas.
Resultados: Após a condução do primeiro estudo, o referente à revisão sistemática de
literatura, 59 artigos considerados relevantes para obtenção de respostas aos
questionamentos propostos por este estudo foram identificados e analisados em sua
totalidade. Tal verificação resultou na revelação de diversas abordagens capazes de
demonstrar como as avaliações online apoiam o desenvolvimento e aperfeiçoamento de
negócios no sector hoteleiro. Os resultados obtidos demonstram que os comentários
extraídos das plataformas de avaliação online mais populares submetidos a técnicas de
mineração de dados e metodologias tais como análise de sentimento, agrupamento de
dados e análise de regressão, têm permitido que académicos e pesquisadores
compreendam quais atributos tangíveis e intangíveis influenciam a satisfação dos
hóspedes de um modo geral, além de segmentar mercados, identificar tendências de
mercado, bem como oportunidades e mudança de comportamento dos consumidores. Embora um número significativo de implicações práticas tenha sido revelado, lacunas de
investigação são identificadas e recomendações para futuros estudos são fornecidas. o
segundo estudo conduzido com base na análise de frequência, bem como na análise de
sentimento de 8.596 avaliações online, extraídas do site TripAdvisor, sobre 161 unidades
hoteleiras localizadas na região do Algarve, em Portugal permitiu demonstrar que, não
somente as taxas de satisfação e insatisfação com relação aos atributos dos hotéis diferem
de acordo com cada mercado, mas também que turistas de diferentes origens geográficas
e contextos culturais, enfatizam esses atributos distintivamente. Ademais, tais revelações
sugerem o uso de análises e técnicas de mineração de dados como uma importante
ferramenta para compreender a perceção dos hóspedes com relação aos atributos dos
hotéis. Desta forma, gestores podem investir seu orçamento de forma mais precisa com
vistas à melhoria dos serviços e produtos oferecidos aos seus clientes.
Implicações da investigação: Para além de contribuir para a literatura existente,
aumentando a pesquisa atual sobre o uso de avaliações online e técnicas de mineração de
dados, os resultados deste estudo também fornecem aos profissionais da indústria
hoteleira informações sobre como tirar proveito destas avaliações, além de identificar
oportunidades de melhoria com base na análise de avaliações textuais de três mercados
Europeus distintos numa mesma plataforma. As diversas formas apresentadas por este
estudo sobre como as avaliações online podem ser analisadas, proporcionam aos gestores
e profissionais do setor hoteleiro ideias de como é possível obter resultados precisos e
atempados sobre a perceção de seus hóspedes. Além disso, algumas dessas aplicações
podem ser menos dispendiosas quando comparadas com abordagens mais tradicionais,
como por exemplo, a aplicação de questionários de satisfação junto aos clientes.
Originalidade: Embora vários estudos se centrem no desenvolvimento de negócios dos
hotéis usando avaliações online, apenas alguns estudos reuniram esses documentos para
verificar as suas aplicações e implicações ao nível da gestão. Outrossim, ainda que um
número significativo de artigos sobre segmentação de marketing através de técnicas de
mineração de dados tenha sido publicado, este estudo analisa a satisfação geral de
hóspedes pertencentes a três relevantes mercados Europeus para o Algarve e sugere
implicações práticas atualizadas para académicos e profissionais do setor hoteleiro. Desta
forma, este trabalho vem preencher essas lacunas de pesquisa.Purpose: The purpose of this study is to verify how online reviews can become a useful
tool to improve the performance of hotel businesses. Therefore, this study is performed
in two stages. Firstly, a systematic literature review is conducted to identify a variety of
general contributions that the analysis of online reviews can bring to hoteliers. Posteriorly,
through the analysis of online reviews, this study verifies how distinct European markets
evaluate a sample of hotels located in the Algarve and checks if satisfaction and
dissatisfaction towards hotel attributes are similar among them.
Methodology: Two different methodologies are approached during this work. First, the
systematic literature review analyses refereed journals containing the keywords: online
reviews, hotel improvement, hotel performance and hotel development, published
between January 2008 and January 2020. Afterwards, this study analyses online reviews
of hotel units located in the Algarve, written in English, French as well as Portuguese
languages and posted on TripAdvisor by British, French and Portuguese residents from
January 2019 to December 2019.
Findings: After examining 59 relevant papers, a range of approaches on how online
reviews support hotel business development are uncovered. Furthermore, the analysis of
8,596 online reviews evidences that satisfaction and dissatisfaction rates towards hotel
attributes differ according to the geographic distance and cultural background. Besides
contributing to the existing literature by extending the current research on the use of
online reviews, results obtained from both stages provide hoteliers with insights to make
better use of online reviews.
Originality: Although several studies approach hotel business development using online
reviews, only a few studies have gathered these papers to verify their managerial
implications. Additionally, this paper analyses customer satisfaction of relevant tourist
markets and suggests up-to-date practical implications for hoteliers, apart from
contributing to extending the research on this field
Sentiment Analysis Across Multiple African Languages: A Current Benchmark
Sentiment analysis is a fundamental and valuable task in NLP. However, due to
limitations in data and technological availability, research into sentiment
analysis of African languages has been fragmented and lacking. With the recent
release of the AfriSenti-SemEval Shared Task 12, hosted as a part of The 17th
International Workshop on Semantic Evaluation, an annotated sentiment analysis
of 14 African languages was made available. We benchmarked and compared current
state-of-art transformer models across 12 languages and compared the
performance of training one-model-per-language versus
single-model-all-languages. We also evaluated the performance of standard
multilingual models and their ability to learn and transfer cross-lingual
representation from non-African to African languages. Our results show that
despite work in low resource modeling, more data still produces better models
on a per-language basis. Models explicitly developed for African languages
outperform other models on all tasks. Additionally, no one-model-fits-all
solution exists for a per-language evaluation of the models evaluated.
Moreover, for some languages with a smaller sample size, a larger multilingual
model may perform better than a dedicated per-language model for sentiment
classification.Comment: Accepted to be published as part of SIAIA @ AAAI 202
- …