Extração e aplicação de indicadores no processo de recomendação de recursos urbanos utilizando dados estruturados e não-estruturados

Abstract

Considerando o estudo do desenvolvimento de sistemas voltados a ambientes urbanos através da Informática Urbana, e tendo que dados referentes a tais de cenário encontramse muitas vezes dispersos, em diferentes formas e estruturas e, em alguns casos, com procedência duvidosa, processos de recuperação e análise de informações tornam-se nãotriviais. Nesse cenário, métodos capazes de extrair informações anteriormente desconhecidas ou não mensuradas e de valor para algum domínio são de fundamental importância. Diante de tal perspectiva, o principal objetivo desta pesquisa consiste em desenvolver uma abordagem capaz de extrair e analisar informações expressas em redes sociais baseadas em localização com o uso de Mineração de Textos, de modo a relacionar aspectos referentes a polaridade de informações e a confiabilidade dos perfis que as difundiram, bem como considerar o momento de avaliação, gerando indicadores a serem aplicados no processo de recomendação de recursos urbanos verificando tal influência ao estimar métricas de avaliação. Para tanto, procede-se a aplicação de uma metodologia baseada em premissas de análise de redes sociais, associada a aplicação de abordagens de Web Mining no processo de descoberta de conhecimentos e análise de dados Como fonte de informações foi utilizado um conjunto de dados contendo 6600 observações coletadas no Foursquare, referentes à cidade de Gramado no Rio Grande do Sul, organizadas em 13 variáveis, além de informações complementares fornecidas pela plataforma DataViva. As características extraídas foram então aplicadas a algoritmos de recomendação baseados em vizinhança e em fatoração de matrizes, de modo a apurar métricas de acurácia com seu uso. Dos resultados obtidos, observa-se que, para algoritmos baseados em vizinhança, a abordagem proposta apresentou resultados melhores quando comparada à abordagem tradicional de avaliação. Entretanto, ao utilizar algoritmos baseados em fatoração de matrizes, as taxas de erro mantém-se com médias e desvios-padrão baixos. Os resultados obtidos foram comparados utilizando testes deWilcoxon com 95% de confiança, o que permite concluir que esses retratam a não uniformidade na distribuição das amostras, evidenciando diferenças significativas entre os resultados obtidos.As a source, a dataset containing 6600 observations was collected at Foursquare, referring to the city of Gramado in Rio Grande do Sul. In this dataset, 13 variables were considered, and complementary information was provided by DataViva platform. The extracted features were applied to recommender approaches based on neighborhood and matrix factorization, and their use was measured in terms of accuracy. From the results, it is observed that the approach based on neighborhood algorithms presented better results when compared to the traditional evaluation approach. However, when using algorithms based on matrix-factorization, error rates are maintained with low standard means and standard deviations. The results obtained with the use of both metrics were compared using Wilcoxon tests with 95% confidence, which concludes that they portray the nonuniformity in the distribution of the samples, evidencing significant differences between the results obtained with the use of the approaches used

    Similar works