743 research outputs found

    A Collaborative Filtering Probabilistic Approach for Recommendation to Large Homogeneous and Automatically Detected Groups

    Get PDF
    In the collaborative filtering recommender systems (CFRS) field, recommendation to group of users is mainly focused on stablished, occasional or random groups. These groups have a little number of users: relatives, friends, colleagues, etc. Our proposal deals with large numbers of automatically detected groups. Marketing and electronic commerce are typical targets of large homogenous groups. Large groups present a major difficulty in terms of automatically achieving homogeneity, equilibrated size and accurate recommendations. We provide a method that combines diverse machine learning algorithms in an original way: homogeneous groups are detected by means of a clustering based on hidden factors instead of ratings. Predictions are made using a virtual user model, and virtual users are obtained by performing a hidden factors aggregation. Additionally, this paper selects the most appropriate dimensionality reduction for the explained RS aim. We conduct a set of experiments to catch the maximum cumulative deviation of the ratings information. Results show an improvement on recommendations made to large homogeneous groups. It is also shown the desirability of designing specific methods and algorithms to deal with automatically detected groups

    A hybrid recommendation approach for a tourism system

    Get PDF
    Many current e-commerce systems provide personalization when their content is shown to users. In this sense, recommender systems make personalized suggestions and provide information of items available in the system. Nowadays, there is a vast amount of methods, including data mining techniques that can be employed for personalization in recommender systems. However, these methods are still quite vulnerable to some limitations and shortcomings related to recommender environment. In order to deal with some of them, in this work we implement a recommendation methodology in a recommender system for tourism, where classification based on association is applied. Classification based on association methods, also named associative classification methods, consist of an alternative data mining technique, which combines concepts from classification and association in order to allow association rules to be employed in a prediction context. The proposed methodology was evaluated in some case studies, where we could verify that it is able to shorten limitations presented in recommender systems and to enhance recommendation quality

    Healthy Track : healthy route recommendation

    Get PDF
    Tese de Mestrado, Informática, 2022, Universidade de Lisboa, Faculdade de CiênciasExistem atualmente vários sistemas de recomendação de caminhos (Waze, Google Maps, etc.) que oferecem ao utilizador sugestões de caminhos entre duas localizações, com suporte para diversos meios de deslocação. Estes sistemas sugerem um ou mais caminhos tipicamente com base em critérios de distância e tempo, i.e., recomendam o(s) caminho(s) mais curto(s)/mais económico(s), por norma não integrando outros critérios da preferência e relevância para o utilizador. Nos percursos pedestres em ambientes urbanos é frequente que a escolha do utilizador não seja baseada no caminho mais curto ou mais rápido, privilegiando outros critérios, como por exemplo, níveis baixos de poluição, jardins e vegetação, segurança e iluminação. O objetivo do presente trabalho é desenvolver um sistema de recomendação de percursos pedestres, entre dois pontos num mapa, considerando múltiplos critérios relevantes e as preferências do utilizador. As contribuições deste trabalho incluem: uma revisão do estado da arte dos sistemas de recomendação, especificamente dos sistemas de recomendação de caminhos e da literatura existente sobre a navegação pedestre, com foco nas preferências dos pedestres nos seus caminhos e com uma discussão de sistemas de recomendação de caminhos pedestres existentes; a base de dados HealthyTrack, que armazena dados geográficos correspondentes a diferentes aspetos da cidade de Lisboa utilizados no cálculo de caminhos saudáveis, e que contém a funcionalidade de recomendação de caminhos com uso da extensão PgRouting; a aplicação web HealthyTrack, que fornece uma interface com mapas interativos, com utilização da biblioteca LeafletJS (uma biblioteca Javascript ou JS de mapas interativos), e permite a interação com o serviço de recomendação de caminhos, para sugerir caminhos saudáveis aos utilizadores. Inicialmente, foi realizada uma pesquisa sobre a taxonomia dos sistemas de recomendação e uma revisão do estado da arte nesta área. Os sistemas de recomendação dividem-se em 3 tipos, de acordo com a sua abordagem de recomendação: recomendações baseadas em conteúdo, onde itens recomendados ao utilizador são similares aos que preferiu no passado; recomendações baseadas em colaboração, onde os itens recomendados são aqueles que utilizadores com preferências semelhantes preferiram no passado; recomendações baseadas numa abordagem híbrida, que combina ambos os métodos anteriores. Todas estas abordagens têm as suas vantagens e desvantagens, derivadas da sua natureza. Cada uma das abordagens pode, inclusive, ser progressivamente dividida em dois tipos de técnicas de recomendação para estimativa de classificação, baseando-se em heurísticas ou modelos, e por tipo de avaliação, baseado em previsão de ranking (classificações implícitas, como cliques em links) ou regressão de classificações (classificações explícitas, como escalas de classificação de 1 a 5 para filmes, por exemplo). Depois foi efetuada uma revisão da literatura existente na área dos sistemas de navegação pedestre, para perceber as necessidades e preferências dos utilizadores nos seus caminhos. No estudo de (Golledge, 1994) reuniram-se 32 adultos que, na primeira fase em laboratório, traçaram o que achavam ser o melhor caminho no mapa de uma zona conhecida desde um ponto A a B, e na segunda fase, no terreno, percorreram um caminho de ida e volta nessa mesma zona sem recurso do mapa. Este estudo tem como objetivo perceber como os pedestres mapeiam e desenham caminhos sem recurso a guias (mapas, GPS) e quais os critérios que os pedestres consideram quando percorrem um caminho, para além da distância. O estudo realizado pelos autores (Borst et al., 2009) analisa a influência do ambiente nos caminhos de pessoas idosas, feito com um grupo de idosos residentes de 3 distritos urbanos da mesma cidade, com criação de um modelo sobre esta influência. Era lhes pedido que traçassem o caminho que normalmente percorrem nas suas viagens para 3 tarefas diferentes. Cada caminho traçado foi comparado com outros caminhos alternativos para o mesmo destino, construídos baseados em diferentes qualidades ao longo dos caminhos. No estudo de (Rodríguez et al., 2015) é feita uma análise sobre a influência do ambiente nos caminhos de raparigas adolescentes, dividida em dois grupos, um de uma área menos suburbana, com maior densidade populacional e mais pobreza, e outro local com condições inversas. Primeiro, os autores definiram “variáveis de qualidade” com base na literatura prévia, as quais caracterizam um caminho, dependentes de métricas que correspondem a diferentes aspetos dos caminhos. Por fim, cada segmento dos caminhos percorridos foi comparado com segmentos alternativos dos caminhos automaticamente gerados com uso de um algoritmo de procura. Em (Czogalla & Herrman, 2017), similarmente aos dois estudos anteriores, foi criado um modelo sobre o processo de decisão de viagem pedestre, com uma introdução do conceito de “atributo de qualidade pedestre”, ou PQA (pedestrian quality atribute), e a sua avaliação por fatores para análise das necessidades de qualidade de viagens pedestres. Este PQA corresponde à soma dos subatributos de qualidade de um caminho. De acordo com estes estudos, pode-se concluir que existe uma preferência dos pedestres por caminhos mais curtos, mais esteticamente atrativos, próximos a zonas verdes, com maior segurança e menor complexidade (menor número de cruzamentos). Seguidamente, foram analisados sistemas de recomendação de caminhos semelhantes àquele planeado para este projeto. O projeto documentado em (Fernandes, Carvalho, & Rito Lima, 2019) descreve um protótipo de um sistema de recomendação para cidades inteligentes, dependente de dados de sensores obtidos em tempo-real, com uso de uma rede de sensores sem fio (RSSF) simulada na plataforma Cupcarbon, uma plataforma open-source de simulação IoT, e para o qual reuniram um número de atributos do caminho que consideraram importantes para o sistema. Em (Ramos, Trilles, Muñoz, & Huerta, 2018), é descrita uma metodologia technology-agnostic para recomendar caminhos livres de poluição, também constituída por uma RSSF, neste caso, de qualidade de ar. Esta metodologia envolve uma análise de vários índices de qualidade de ar, a criação de um novo índice específico ao problema, e a seleção de um modelo de interpolação para criar um conjunto de “obstáculos” que representam as áreas com pior qualidade de ar da cidade de Madrid, que o sistema ignora, desenhando caminhos que evitam estas zonas Outro sistema apresentado em (Novack, Wang, & Zipf, 2018) foi implementado com o intuito de gerar caminhos pedestres “agradáveis” e personalizáveis pelos utilizadores. Este sistema utiliza dados do OpenStreetMap (OSM) para caracterizar cada segmento e um algoritmo de procura para gerar caminhos multiobjectivo, ao unir os atributos do caminho numa única fórmula de custo que considera os pesos de cada atributo, definidos pelo utilizador. Estes projetos também ajudaram a reunir os requisitos dos sistemas sobre as preferências dos pedestres, tal como mencionado anteriormente, nomeadamente, a iluminação, menor complexidade dos caminhos e fatores ambientais (como a qualidade de ar e temperatura). Paralelamente, foram analisadas APIs e bibliotecas de mapas interativos para JS, já que um dos objetivos deste projeto é construir uma interface web para o sistema HealthyTrack. Com uso da API dos Google Maps, foram criadas umas páginas web com mapas, para testar o uso de ferramentas de mapas interativos na web. Por fim, foi decidido que seria melhor usar Leaflet para implementar as funcionalidades de mapas interativos da aplicação. Depois disto, foi implementada a base de dados PostgreSQL HealthyTrack, com instalação da extensão PostGIS (para a gestão de dados geográficos). Selecionou-se esta base de dados por ser a solução mais popular para armazenar dados geográficos (com possibilidade de extensão com outras funcionalidades GIS). Esta base de dados contém as tabelas com os dados necessários para armazenar aspetos dos caminhos que são essenciais para as recomendações, tais como a tabela de dados de qualidade de ar e a tabela com as localizações das zonas verdes de Lisboa. Contém também a rede de estradas utilizada para criar os caminhos, que serão criados com uso dos segmentos de rua desta tabela. O sistema de recomendação de caminhos tem por base um algoritmo de pathfinding (procura de caminhos), utilizado para a construção de caminhos com uso da extensão PgRouting, na base de dados. Com esta extensão, a rede de estradas pode ser transformada num grafo, para depois se fazerem queries de modo a obter caminhos mais curtos. Para visualizar os resultados das queries de caminhos o PgRouting foi instalado também no QGIS, que foi utilizado, em geral, para facilitar a gestão de dados do sistema. Finalmente, foi implementada a aplicação web para o sistema HealthyTrack, baseada em NodeJS, com uso de ExpressJS que fornece o serviço de recomendação de caminhos. Com uso do Leaflet no lado cliente, os mapas interativos e resultados de pedidos de recomendação de caminhos são apresentados. Por fim, foram realizadas umas experiências onde a funcionalidade de recomendação de caminhos pelo sistema HealthyTrack foi validada, sendo possível verificar que os caminhos mais verdes e mais limpos são normalmente distintos dos caminhos mais rápidos, priorizando os critérios de qualidade respetivos. Para concluir e refletir sobre o possível trabalho futuro nesta área, possíveis avanços incluem melhorar as fórmulas de custo, já que estas são algo rudimentares, explorar outros fatores de qualidade de caminho, como por exemplo, níveis de iluminação das ruas (abrangido pelo critério de segurança), estética dos caminhos, fatores tais como meteorologia e hora do dia (que poderiam ser utilizados, por exemplo, de dia, para evitar exposição excessiva a raios UV, ou para evitar a chuva nos caminhos, e para priorizar níveis altos de iluminação a noite), complexidade dos caminhos (número de cruzamentos), qualidade e declive do piso (especialmente em subidas) e níveis de poluição sonora. Para além disto, também se poderia explorar a possibilidade de o utilizador adicionar múltiplas paragens a um caminho. Outro aspeto a investigar no futuro poderia ser a combinação de vários critérios numa só fórmula de custo, como foi feito no sistema implementado por (Novack et al., 2018), com possibilidade de personalização por parte do utilizador dos seus caminhos. Por fim, aspetos a melhorar na interface da aplicação web ou a adicionar a futuras interfaces incluem a adição de um tutorial para uso das funcionalidades e para contexto sobre cada caminho, e mostrar informação sobre cada caminho quando se faz hover ou clique por cima deste, por exemplo (informação sobre o tempo de viagem, complexidade do caminho, etc.), dando especial importância em informar sobre a vantagem de escolher esse caminho (mais limpo, mais verde, etc.).Currently, there exist many route recommendation systems, e.g., Waze, Google Maps, among others, which offer the user suggestions for routes between two locations, supporting several means of transportation (e.g., car, foot and public transportation). These systems propose one or more routes often based on distance, cost and duration criteria, i.e., they recommend the fastest and/or most economic route(s) (where gas cost, toll charging and/or ticket purchasing is considered). Additionally, these systems may rely on other route characteristics, such as real-time traffic information, to improve the quality of recommendation provided to the user. These general use route recommender systems, which are very focused on public and private transportation, are, however, limited to economic criteria, disregarding other types of preference criteria for the user. For pedestrian courses in urban surroundings, it’s common that the user’s choice of route isn’t the fastest/most direct/most economic, as they often prioritize other criteria, favoring routes where they are exposed to lower levels of pollution, more fresh air, vegetation and aesthetic scenery and, especially at night, less safety hazards and more lighting. The goal of this project is to develop a route recommendation system for pedestrian courses, between two points on a map, considering multiple relevant criteria and users’ preferences. The developed system, called HealthyTrack, allows the user to request route recommendations from two points selected on the map, presenting the user with a faster route and two alternatives, a route that prioritizes air quality and another that prioritizes proximity to green spaces. This solution is focused on promoting the health of pedestrians and is based on their preferences and needs

    A genetic‐based pairwise trip planner recommender system

    Get PDF
    The massive growth of internet users nowadays can be a big opportunity for the busi- nesses to promote their services. This opportunity is not only for e-commerce, but also for other e-services, such as e-tourism. In this paper, we propose an approach of personalized recommender system with pairwise preference elicitation for the e-tourism domain area. We used a combination of Genetic Agorithm with pairwise user prefer- ence elicitation approach. The advantages of pairwise preference elicitation method, as opposed to the pointwise method, have been shown in many studies, including to reduce incosistency and confusion of a rating number. We also performed a user evaluation study by inviting 24 participants to examine the proposed system and publish the POIs dataset which contains 201 attractions used in this study

    Crop Yield Prediction Using Deep Neural Networks

    Get PDF
    Crop yield is a highly complex trait determined by multiple factors such as genotype, environment, and their interactions. Accurate yield prediction requires fundamental understanding of the functional relationship between yield and these interactive factors, and to reveal such relationship requires both comprehensive datasets and powerful algorithms. In the 2018 Syngenta Crop Challenge, Syngenta released several large datasets that recorded the genotype and yield performances of 2,267 maize hybrids planted in 2,247 locations between 2008 and 2016 and asked participants to predict the yield performance in 2017. As one of the winning teams, we designed a deep neural network (DNN) approach that took advantage of state-of-the-art modeling and solution techniques. Our model was found to have a superior prediction accuracy, with a root-mean-square-error (RMSE) being 12% of the average yield and 50% of the standard deviation for the validation dataset using predicted weather data. With perfect weather data, the RMSE would be reduced to 11% of the average yield and 46% of the standard deviation. We also performed feature selection based on the trained DNN model, which successfully decreased the dimension of the input space without significant drop in the prediction accuracy. Our computational results suggested that this model significantly outperformed other popular methods such as Lasso, shallow neural networks (SNN), and regression tree (RT). The results also revealed that environmental factors had a greater effect on the crop yield than genotype.Comment: 9 pages, Presented at 2018 INFORMS Conference on Business Analytics and Operations Research (Baltimore, MD, USA). One of the winning solutions to the 2018 Syngenta Crop Challeng

    Serendipitous News Discovery Increases News Consumption in News Recommender Systems

    Get PDF
    News recommender system users obtain news via incidental exposure to news and experience serendipity in the incidental news consumption. Serendipitous news discovery, the same as serendipity, refers to discovering unexpected and useful information unintentionally. Researchers suggest building serendipitous news recommender systems and increasing serendipitous news discovery to increase the diversity of the news consumption. However, the impacts of serendipitous news discovery on news consumption are uninvestigated, and rare research provides theoretical guidance to the serendipitous news recommender systems. The thesis investigated the impacts of serendipitous news discovery on news consumption with a serendipityrelated emotion, surprise, as a mediator and need for activation as a moderator. 463 participants recruited from Amazon MTurk completed the online survey-experiment. The findings suggest that surprise mediates the correlations between serendipitous news discovery and news consumption. Users who experience higher serendipitous news discovery indicate more positive attitudes on news consumption in the news recommender systems. The results also indicate the possibility that the lack of constant serendipitous news discovery may lead to the consumption of the news similar to the news that trigger serendipity. The research suggests that serendipitous news discovery increases news consumption, including news selection and reading

    2020 SDSU Data Science Symposium Program

    Get PDF
    https://openprairie.sdstate.edu/ds_symposium_programs/1002/thumbnail.jp

    Applicability of artificial intelligence in e-commerce fashion platforms

    Get PDF
    A inovação tecnológica e a democratização da inteligência artificial (IA) têm vindo a alavancar o potencial de sucesso em todas as áreas que conhecemos hoje, com expectativas do que ainda está para vir. A presente dissertação propõe uma análise das aplicações da IA na indústria da moda, particularmente nas plataformas de marcas de moda do comércio eletrónico, e de que forma está a ter impacto na esfera pessoal do consumidor, particularmente no processo de tomada de decisão dos consumidores da Geração Z. O âmbito da IA tem vindo a evoluir de tal forma que permitiu às empresas não só melhorar a sua oferta e a procura dos clientes, como também proporcionar uma experiência de compra que vai para além da “seleção e compra” mecânica: os pontos de contacto impulsionados pela IA influenciam e enriquecem cada fase do processo de tomada de decisão, seja de forma mais positiva ou negativa. Em última análise, esta dissertação pretende proporcionar ao leitor um melhor conhecimento sobre a IA e o comércio eletrónico de moda, bem como delinear o seu impacto no comportamento online do consumidor.Technological innovation and democratization of artificial intelligence (AI) have been leveraging the potential success in every field we know today, while more is yet to come. The following dissertation proposes an analysis of AI achievements within the fashion industry, particularly in e-commerce fashion brand platforms, and how it is impacting the consumer personal sphere, particularly the decision-making process of Gen-Z consumers. The field of AI has been evolving in such a way that allows companies to not only improve their supply and customer demand, but also provide a shopping experience that goes beyond the mechanical “select and buy“: AI-driven touchpoints influence and enrich each stage of the decision-making process, whether more positively or negatively. Ultimately, this dissertation intends to provide the reader a better knowledge of AI and fashion e-commerce joining applications, and to delineate its impact on the online customer journey

    Gamification of assembly planning in virtual environment

    Get PDF
    Purpose: The purpose of this paper is to study the effect of the gamification of virtual assembly planning on the user performance, user experience and engagement. / Design/methodology/approach: A multi-touch table was used to manipulate virtual parts and gamification features were integrated into the virtual assembly environment. An experiment was conducted in two conditions: a gamified and a non-gamified virtual environment. Subjects had to assemble a virtual pump. The user performance was evaluated in terms of the number of errors, the feasibility of the generated assembly sequence and the user feedback. / Findings: The gamification reduced the number of errors and increased the score representing the number of right decisions. The results of the subjective and objective analysis showed that the number of errors decreased with engagement in the gamified assembly. The increase in the overall user experience reduced the number of errors. The subjective evaluation showed a significant difference between the gamified and the non-gamified assembly in terms of the level of engagement, the learning usability and the overall experience. / Research limitations/implications: The effective learning retention after training has not been tested, and longitudinal studies are necessary. The effect of the used gamification elements has been evaluated as a whole; further work could isolate the most beneficial features and add other elements that might be more beneficial for learning. / Originality/value: The research reported in this paper provides valuable insights into the gamification of virtual assembly using a low-cost multi-touch interface. The results are promising for training operators to assemble a product at the design stage
    corecore