4 research outputs found
Most valued factors in rural tourism: An analysis of Portuguese customer comments on a booking platform
This study aims to discover and analyze the most valued factors in rural tourism. An analysis of a sample with 9,939 comments obtained from the booking platform Booking.com on stays in rural tourism establishments located in Portugal is presented. Using text mining techniques and topic modeling in order to find the most valued factors, word clouds were obtained that allow a quick and intuitive analysis of the data. The LDA algorithm allowed to extract ten topics coherent with the word clouds. The results point out that breakfast, the friendliness of the staff, the hosts and the outdoor space are the most relevant factors for guests. These results have implications for the management of rural tourism units as they identify the factors to be taken into account by those in charge of these units
Identificação de fatores que levam à escolha da realização de turismo rural em Portugal utilizando técnicas de Text Mining na plataforma Booking.com
Este estudo pretende descobrir e analisar os fatores mais valorizados no turismo rural,
tendo em conta os aspetos positivos e negativos inerentes à estadia em estabelecimentos
deste sector turístico. Apresenta-se uma análise de uma amostra com 14.976 comentários
obtidos da plataforma de reservas Booking.com sobre estadias em estabelecimentos de
turismo rural localizados em Portugal entre 2018 e 2021. Usando técnicas de mineração
de texto e modelação por tópicos com o objetivo de encontrar os fatores mais valorizados,
obtiveram-se nuvens de palavras que permitem uma análise rápida e intuitiva aos dados.
O algoritmo Latent Dirichlet Allocation permitiu extrair dez tópicos coerentes com as
nuvens de palavras. Os resultados apontam para que o pequeno-almoço, a simpatia do
pessoal, os anfitriões e o espaço exterior sejam os fatores mais relevantes para os hóspedes
quando falamos em aspetos positivos. Em termos de aspetos negativos, o pequenoalmoço, limpeza da casa de banho, dificuldades de acesso, rede e WiFi foram os mais
relevantes para o estudo. Concluiu-se também que os tópicos encontrados dizem, em
grande parte, respeito a fatores controláveis pelo proprietário do estabelecimento.
Foi também analisada a coerência, prevalência e relação entre tópicos para os fatores mais
valorizados positivamente pelos utilizadores. Estes resultados têm implicação para a
gestão das unidades de turismo rural pois identificam os fatores a ter em atenção pelos
responsáveis destas unidades
Análise e previsão de audiências no mercado televisivo e de comunicação em Portugal
O futebol é um desporto que foi transformado num negócio à escala global devido ao seu
mediatismo e universalidade. Apesar das origens humildes, movimenta milhões de euros
em todo o mundo e tem impacto em toda a sociedade. Uma das fontes de receitas que
alimenta o negócio do futebol é a publicidade, pois constitui um espaço que diversas
marcas aproveitam para se promover e fazer crescer os seus negócios rapidamente.
Associado à publicidade estão as audiências televisivas dos jogos, pois são um barómetro
do número de pessoas alcançadas em cada encontro e permitem aos diversos agentes
envolvidos no desporto aferir os públicos a que conseguem chegar e em que quantidade.
Sabendo da importância dos dados audiométricos no negócio do futebol, este projeto
pretende encontrar fatores que justifiquem e prevejam as audiências televisivas, no
contexto dos campeonatos portugueses. Foram considerados todos os jogos da Primeira
e Segunda Liga de Portugal, nas épocas de 2018/2019 e de 2019/2020, esta última
marcada por uma interrupção causada pela Covid-19 e, posteriormente, com jogos
disputados à porta fechada, uma situação transversal a todo o globo e sem precedentes.
A metodologia utilizada foi a CRISP-DM e tem seis fases: entendimento do negócio,
entendimento dos dados, preparação dos dados, modelação, avaliação do modelo e
implementação do modelo. O conjunto de dados é constituído por 798 transmissões de
jogos de futebol, caracterizados através de 55 variáveis, assentes em atributos do jogo, do
desempenho das equipas, do contexto geográfico, económico e demográfico em que as
equipas estão inseridas e ainda relativos às audiências que essas transmissões alcançaram.
O modelo final proposto é o mais simples dos quatro modelos analisados e inclui o poder
de compra dos munícipes associados às equipas, os valores de mercado dos plantéis, o
preço dos canais televisivos e o número de jogos em simultâneo como as variáveis
independentes que mostraram assumir influência significativa nas audiências televisivas.
Este estudo propõe um modelo a utilizar futuramente em novos trabalhos pela Academia
e um conhecimento valioso para as partes interessadas no negócio do futebol, tais como
as televisões, clubes e patrocinadores, poderem otimizar as audiências televisivas dos
adeptos no futuro. Algumas limitações deste projeto foram apresentadas e alguns
trabalhos para o futuro foram também proposto
Previsão de emoções a partir de mineração de texto no Twitter
As emoções tiveram um papel fundamental para a adaptação e sobrevivência humana ao
longo de toda história da nossa civilização, tendo ganho mais destaque na comunicação
social nos últimos tempos com a criação e avanço das redes sociais. Na área de
inteligência artificial, robôs têm simulado emoções humanas e por meio da visão
computacional as expressões faciais têm sido detetadas. No marketing elas se destacam
ao proporcionar experiências marcantes conectando o cliente ao consumidor.
Com propósito de cooperar no estudo das emoções, ainda que minimamente, esse trabalho
objetivou desenvolver uma forma de identificar as emoções nos textos do Twitter, no
cenário político brasileiro. Além de buscar padrões semânticos que diferenciasse as
emoções, também foram aplicadas técnicas de classificação por meio de aprendizado de
máquina.
A metodologia adotada neste estudo foi a CRISP-DM. A investigação baseou-se nas seis
emoções primárias: tristeza, raiva, surpresa, medo, nojo e alegria. O conjunto de dados
constituído por 3556 tweets foi retirado do Twitter, utilizando 190 Tred Topics sobre
assuntos políticos do dia 22 de junho de 2020 até o dia 24 de agosto 2020.
Uma das principais contribuições deste estudo foi a forma como se fez a identificação e
classificação das emoções nos textos foi desenvolvida a partir dos temas e gatilhos inatos.
Alguns padrões se mostraram relevantes, como por exemplo, para raiva e nojo-desprezo
onde os usuários tendem a utilizar palavras com significado de afastamento de grupo,
enquanto para alegria mais palavras com sentimento de pertencimento a grupo. A precisão
média do classificador foi de 75,61%. O estudo evidenciou a polarização política num
sentido onde as pessoas se opuseram completamente umas contra as outras, discordando,
demonstrando emoções maioritariamente pesadas, desejando o mal e até a morte umas
das outras. Uma limitação importante foi a falta de mais poder computacional, limitando
assim a afinação dos classificadores por meio de GridSearch. Outra limitação foi a de que
alguns tweets possuíam duas emoções, como raiva e alegria, dificultado a sua
classificação em uma única emoção. Algumas propostas de trabalhos futuros foram
também avançadas