7 research outputs found

    Collaborative Filtering Similarity Algorithm Using Common Items

    Get PDF
    Collaborative filtering (CF) plays an important role in reducing information overload by providing personalized services. CF is widely applied, but common items are not taken account in the similarity algorithm, which reduces the recommendation effect. To address this issue, we propose several methods to improve the similarity algorithm by considering common items, and apply the proposed methods to CF recommender systems. Experiments show that our methods demonstrate significant improvements over traditional CF

    Matrix completion of noisy graph signals via proximal gradient minimization

    Get PDF
    ©2017 IEEE. Personal use of this material is permitted. Permission from IEEE must be obtained for all other uses, in any current or future media, including reprinting/republishing this material for advertising or promotional purposes, creating new collective works, for resale or redistribution to servers or lists, or reuse of any copyrighted component of this work in other works.This paper takes on the problem of recovering the missing entries of an incomplete matrix, which is known as matrix completion, when the columns of the matrix are signals that lie on a graph and the available observations are noisy. We solve a version of the problem regularized with the Laplacian quadratic form by means of the proximal gradient method, and derive theoretical bounds on the recovery error. Moreover, in order to speed up the convergence of the proximal gradient, we propose an initialization method that utilizes the structural information contained in the Laplacian matrix of the graph.Peer ReviewedPostprint (author's final draft

    Generalization error bounds for kernel matrix completion and extrapolation

    Get PDF
    © 2020 IEEE. Personal use of this material is permitted. Permission from IEEE must be obtained for all other uses, in any current or future media, including reprinting/republishing this material for advertising or promotional purposes,creating new collective works, for resale or redistribution to servers or lists, or reuse of any copyrighted component of this work in other works.Prior information can be incorporated in matrix completion to improve estimation accuracy and extrapolate the missing entries. Reproducing kernel Hilbert spaces provide tools to leverage the said prior information, and derive more reliable algorithms. This paper analyzes the generalization error of such approaches, and presents numerical tests confirming the theoretical resultsThis work is supported by ERDF funds (TEC2013-41315-R and TEC2016-75067-C4-2), the Catalan Government (2017 SGR 578), and NSF grants(1500713, 1514056, 1711471 and 1509040).Peer ReviewedPostprint (published version

    Recommendation of collaborative filtering for a technological surveillance model using Multi-Dimension Tensor Factorization

    Get PDF
    Technological surveillance in research centers and universities focuses on carrying out a systematic follow-up on the development of research lines, the research leaders, the possibilities of scientific-technological collaboration, and to the knowledge of current trends from research. All these elements allow guiding the researches and supporting the scientific-technological strategy. This research proposes a model of technological surveillance supported by a recommendation system as an application that focuses on the preferences of researchers in universities and research centers. The multidimensional tensor factorization approach, based on grouping to build a recommendation system and to validate the increase in tensors, improves the accuracy of the recommendation. The experiments have been carried out in real data sets as the university and research centers. The results confirm that the dispersion issues are improved within a wider margin in both data sets. In addition, the proposed approach states that the increase in the number of dimensions shows a 7-10% improvement in accuracy and memory, which increases performance as an expert recommendation system

    Improved collaborative filtering using clustering and association rule mining on implicit data

    Get PDF
    The recommender systems are recently becoming more significant due to their ability in making decisions on appropriate choices. Collaborative Filtering (CF) is the most successful and most applied technique in the design of a recommender system where items to an active user will be recommended based on the past rating records from like-minded users. Unfortunately, CF may lead to poor recommendation when user ratings on items are very sparse (insufficient number of ratings) in comparison with the huge number of users and items in user-item matrix. In the case of a lack of user rating on items, implicit feedback is used to profile a user’s item preferences. Implicit feedback can indicate users’ preferences by providing more evidences and information through observations made on users’ behaviors. Data mining technique, which is the focus of this research, can predict a user’s future behavior without item evaluation and can too, analyze his preferences. In order to investigate the states of research in CF and implicit feedback, a systematic literature review has been conducted on the published studies related to topic areas in CF and implicit feedback. To investigate users’ activities that influence the recommender system developed based on the CF technique, a critical observation on the public recommendation datasets has been carried out. To overcome data sparsity problem, this research applies users’ implicit interaction records with items to efficiently process massive data by employing association rules mining (Apriori algorithm). It uses item repetition within a transaction as an input for association rules mining, in which can achieve high recommendation accuracy. To do this, a modified preprocessing has been employed to discover similar interest patterns among users. In addition, the clustering technique (Hierarchical clustering) has been used to reduce the size of data and dimensionality of the item space as the performance of association rules mining. Then, similarities between items based on their features have been computed to make recommendations. Experiments have been conducted and the results have been compared with basic CF and other extended version of CF techniques including K-Means Clustering, Hybrid Representation, and Probabilistic Learning by using public dataset, namely, Million Song dataset. The experimental results demonstrate that the proposed technique exhibits improvements of an average of 20% in terms of Precision, Recall and Fmeasure metrics when compared to the basic CF technique. Our technique achieves even better performance (an average of 15% improvement in terms of Precision and Recall metrics) when compared to the other extended version of CF techniques, even when the data is very sparse

    Modélisation de la production de pâtes alimentaires traditionnelles et enrichies

    Get PDF
    Les pâtes enrichies représentent un produit d’intérêt pour l’industrie, car elles offrent aux consommateurs la possibilité de profiter des bienfaits sur la santé de l’ingrédient d’enrichissement sans modifier leurs habitudes alimentaires. Cependant, la durée et le coût du développement de nouvelles pâtes enrichies sont significatifs et limitent leur probabilité de succès commercial. Dans cette thèse, des modèles ont été développés pour décrire la production des pâtes traditionnelles et enrichies et accélérer leur développement. Deux objectifs généraux ont été poursuivis. Le premier objectif était l’identification et la quantification des mécanismes de transfert affectant la qualité des pâtes lors du séchage, leur étape de transformation la plus importante. L’état de l’art a révélé que les modèles développés précédemment pour décrire le séchage des pâtes combinent la description des mécanismes de transfert de masse de l’eau à partir d’un coefficient de diffusion effectif. La qualité de ces modèles a été évaluée par analyses de sensibilité, d’incertitude et d’identifiabilité. Ces analyses ont montré que l’incertitude des modèles précédents sur la prédiction du temps de séchage requis est importante (environ ± 4 h) et que cette incertitude peut être expliquée par la faible identifiabilité pratique des coefficients de transfert de masse à partir de mesures bruitées de la teneur en eau. L’analyse des modèles de séchage précédents a également montré leur imprécision à décrire les profils internes de teneur en eau générés dans les pâtes lors du séchage, alors que ces profils en eau sont critiques à la prédiction de la formation de craques. Cette thèse a donc conduit au développement d’un nouveau modèle de séchage mécanistique, couplant le transfert de masse de l’eau liquide par capillarité et convection, le transfert de masse de l’eau vapeur par diffusion et convection, le transfert d’énergie par conduction, convection et évaporation et la déformation mécanique. Ce modèle a été validé pour 3 températures de séchage (40, 60 et 80 ºC) représentatives des conditions utilisées en industrie. Le deuxième objectif était la quantification de l’impact de l’enrichissement et des variables de procédé sur les propriétés des pâtes. Cet objectif a été atteint par la construction et la méta-analyse d’une base de données regroupant les propriétés des pâtes traditionnelles et enrichies mesurées dans la littérature. Les propriétés manquantes de la base de données ont été estimées par le développement d’une approche novatrice et originale basée sur la complétion de matrice. L’approche par complétion de matrice a permis d’expliquer en moyenne 40% de la variance des propriétés manquantes. Elle a également permis de déterminer pour près de 20% des propriétés manquantes, avec un niveau de confiance de plus de 90%, si elles sont supérieures ou inférieures à la valeur moyenne de la propriété, améliorant la caractérisation du produit sans coût expérimental additionnel. Les travaux de cette thèse ont conduit à la réalisation de 7 articles dans des revues avec comité de lecture et ont été présentés à 4 congrès internationaux. Les travaux ont permis le développement de 2 outils, le modèle de séchage mécanistique et l’estimation des propriétés manquantes par complétion de matrice, que l’industrie pourra utiliser pour accélérer le développement de nouvelles pâtes enrichies. Plusieurs contributions majeures de cette thèse, notamment l’établissement des conditions expérimentales pour l’identifiabilité pratique des coefficients de transfert de masse et les méthodologies pour la méta-analyse d’un produit et l’estimation de ses propriétés manquantes par complétion de matrice, ont été appliquées aux pâtes enrichies, mais leur impact s’étend à de nombreux produits et procédés
    corecore