46 research outputs found

    A Class of Graph-Geodetic Distances Generalizing the Shortest-Path and the Resistance Distances

    Get PDF
    A new class of distances for graph vertices is proposed. This class contains parametric families of distances which reduce to the shortest-path, weighted shortest-path, and the resistance distances at the limiting values of the family parameters. The main property of the class is that all distances it comprises are graph-geodetic: d(i,j)+d(j,k)=d(i,k)d(i,j)+d(j,k)=d(i,k) if and only if every path from ii to kk passes through jj. The construction of the class is based on the matrix forest theorem and the transition inequality.Comment: 14 pages. Discrete Applied Mathematic

    Link Prediction in Complex Networks: A Survey

    Full text link
    Link prediction in complex networks has attracted increasing attention from both physical and computer science communities. The algorithms can be used to extract missing information, identify spurious interactions, evaluate network evolving mechanisms, and so on. This article summaries recent progress about link prediction algorithms, emphasizing on the contributions from physical perspectives and approaches, such as the random-walk-based methods and the maximum likelihood methods. We also introduce three typical applications: reconstruction of networks, evaluation of network evolving mechanism and classification of partially labelled networks. Finally, we introduce some applications and outline future challenges of link prediction algorithms.Comment: 44 pages, 5 figure

    Transcultural adaptation tested by cultural diversity : the case of new metric scale of intelligence (NEMI-2) in the moroccan context

    No full text
    Le bilan psychologique est un outil essentiel en clinique pour la compréhension des enfants et adolescents. Appliqué dans un contexte culturel éloigné de celui où les outils d’évaluation psychologique ont été conçus, cela devient un exercice complexe. Nous avons articulé cette question de recherche autour de trois axes principaux : une enquête de terrain sur l’utilisation des tests psychologiques au Maroc dans le but de cerner les problématiques et les pratiques en vigueur chez les cliniciens locaux en l’absence d’outils adaptés. L’adaptation culturelle de la NEMI-2 à la population marocaine à l’aide des recommandations de la littérature afin de mettre en lumière toute la complexité du passage entre deux univers culturels et langagiers lors de l’adaptation. Le pré-test de la version préliminaire de la NEMI-2 sur un terrain marocain marqué par la diversité et le métissage de ses références culturelles. Nous questionnerons les spécificités observées chez les enfants composant notre échantillon et nous interrogerons plus globalement la démarche d’adaptation culturelle. Notamment, la question du bilinguisme, très présente et reflétant de manière remarquable la manière dont se décline la diversité culturelle au sein de la société. Face à une réalité mouvante et en changement, comment le clinicien peut-il être à l’écoute de l’individu dans son contexte et s’ouvrir à la complexité et la multiplicité de ce qui façonne son monde ?The psychological assessment is an essential clinical tool for the understanding of children and adolescents. When applied in a culturally distant context from where the psychological assessment tools were originally designed, it can become a very challenging exercise. We have structured this research topic on three main areas: A Field Survey on the usage of psychological tests in Morocco with the objective of pinpointing the current issues and practices of the local clinicians in the lack of adapted tools. The cultural adaptation of the NEMI-2 to the Moroccan population based on literature guidelines to highlight the complexity of moving between two cultural and linguistic environments during this adaptation.Pre-test of the first version of the NEMI-2 on a Moroccan context characterized by the diversity and the blending of its cultural references. We question the specific features observed among the children in our sampling and, more globally, we examine the process of transcultural adaptation. In particularly, the question of the bilingualism, very present and showing in a noticeable way how the diversity of cultures is present in the society. Confronted with a changing reality, what can clinicians do to be attentive to the individuals in their context and open themselves to the complexity and multiplicity of what shapes their world

    L’adaptation culturelle à l’épreuve de la diversité : cas de la nouvelle échelle métrique de l’intelligence (NEMI-2) en terrain marocain

    No full text
    The psychological assessment is an essential clinical tool for the understanding of children and adolescents. When applied in a culturally distant context from where the psychological assessment tools were originally designed, it can become a very challenging exercise. We have structured this research topic on three main areas: A Field Survey on the usage of psychological tests in Morocco with the objective of pinpointing the current issues and practices of the local clinicians in the lack of adapted tools. The cultural adaptation of the NEMI-2 to the Moroccan population based on literature guidelines to highlight the complexity of moving between two cultural and linguistic environments during this adaptation.Pre-test of the first version of the NEMI-2 on a Moroccan context characterized by the diversity and the blending of its cultural references. We question the specific features observed among the children in our sampling and, more globally, we examine the process of transcultural adaptation. In particularly, the question of the bilingualism, very present and showing in a noticeable way how the diversity of cultures is present in the society. Confronted with a changing reality, what can clinicians do to be attentive to the individuals in their context and open themselves to the complexity and multiplicity of what shapes their world ?Le bilan psychologique est un outil essentiel en clinique pour la compréhension des enfants et adolescents. Appliqué dans un contexte culturel éloigné de celui où les outils d’évaluation psychologique ont été conçus, cela devient un exercice complexe. Nous avons articulé cette question de recherche autour de trois axes principaux : une enquête de terrain sur l’utilisation des tests psychologiques au Maroc dans le but de cerner les problématiques et les pratiques en vigueur chez les cliniciens locaux en l’absence d’outils adaptés. L’adaptation culturelle de la NEMI-2 à la population marocaine à l’aide des recommandations de la littérature afin de mettre en lumière toute la complexité du passage entre deux univers culturels et langagiers lors de l’adaptation. Le pré-test de la version préliminaire de la NEMI-2 sur un terrain marocain marqué par la diversité et le métissage de ses références culturelles. Nous questionnerons les spécificités observées chez les enfants composant notre échantillon et nous interrogerons plus globalement la démarche d’adaptation culturelle. Notamment, la question du bilinguisme, très présente et reflétant de manière remarquable la manière dont se décline la diversité culturelle au sein de la société. Face à une réalité mouvante et en changement, comment le clinicien peut-il être à l’écoute de l’individu dans son contexte et s’ouvrir à la complexité et la multiplicité de ce qui façonne son monde

    Novel measures on directed graphs and applications to large-scale within-network classification

    No full text
    Ces dernières années, les réseaux sont devenus une source importante d’informations dans différents domaines aussi variés que les sciences sociales, la physique ou les mathématiques. De plus, la taille de ces réseaux n’a cessé de grandir de manière conséquente. Ce constat a vu émerger de nouveaux défis, comme le besoin de mesures précises et intuitives pour caractériser et analyser ces réseaux de grandes tailles en un temps raisonnable.La première partie de cette thèse introduit une nouvelle mesure de similarité entre deux noeuds d’un réseau dirigé et pondéré :la covariance “sum-over-paths”. Celle-ci a une interprétation claire et précise :en dénombrant tous les chemins possibles deux noeuds sont considérés comme fortement corrélés s’ils apparaissent souvent sur un même chemin – de préférence court. Cette mesure dépend d’une distribution de probabilités, définie sur l’ensemble infini dénombrable des chemins dans le graphe, obtenue en minimisant l'espérance du coût total entre toutes les paires de noeuds du graphe sachant que l'entropie relative totale injectée dans le réseau est fixée à priori. Le paramètre d’entropie permet de biaiser la distribution de probabilité sur un large spectre :allant de marches aléatoires naturelles où tous les chemins sont équiprobables à des marches biaisées en faveur des plus courts chemins. Cette mesure est alors appliquée à des problèmes de classification semi-supervisée sur des réseaux de taille moyennes et comparée à l’état de l’art.La seconde partie de la thèse introduit trois nouveaux algorithmes de classification de noeuds en sein d’un large réseau dont les noeuds sont partiellement étiquetés. Ces algorithmes ont un temps de calcul linéaire en le nombre de noeuds, de classes et d’itérations, et peuvent dés lors être appliqués sur de larges réseaux. Ceux-ci ont obtenus des résultats compétitifs en comparaison à l’état de l’art sur le large réseaux de citations de brevets américains et sur huit autres jeux de données. De plus, durant la thèse, nous avons collecté un nouveau jeu de données, déjà mentionné :le réseau de citations de brevets américains. Ce jeu de données est maintenant disponible pour la communauté pour la réalisation de tests comparatifs.La partie finale de cette thèse concerne la combinaison d’un graphe de citations avec les informations présentes sur ses noeuds. De manière empirique, nous avons montré que des données basées sur des citations fournissent de meilleurs résultats de classification que des données basées sur des contenus textuels. Toujours de manière empirique, nous avons également montré que combiner les différentes sources d’informations (contenu et citations) doit être considéré lors d’une tâche de classification de textes. Par exemple, lorsqu’il s’agit de catégoriser des articles de revues, s’aider d’un graphe de citations extrait au préalable peut améliorer considérablement les performances. Par contre, dans un autre contexte, quand il s’agit de directement classer les noeuds du réseau de citations, s’aider des informations présentes sur les noeuds n’améliora pas nécessairement les performances.La théorie, les algorithmes et les applications présentés dans cette thèse fournissent des perspectives intéressantes dans différents domaines.In recent years, networks have become a major data source in various fields ranging from social sciences to mathematical and physical sciences. Moreover, the size of available networks has grow substantially as well. This has brought with it a number of new challenges, like the need for precise and intuitive measures to characterize and analyze large scale networks in a reasonable time. The first part of this thesis introduces a novel measure between two nodes of a weighted directed graph: The sum-over-paths covariance. It has a clear and intuitive interpretation: two nodes are considered as highly correlated if they often co-occur on the same -- preferably short -- paths. This measure depends on a probability distribution over the (usually infinite) countable set of paths through the graph which is obtained by minimizing the total expected cost between all pairs of nodes while fixing the total relative entropy spread in the graph. The entropy parameter allows to bias the probability distribution over a wide spectrum: going from natural random walks (where all paths are equiprobable) to walks biased towards shortest-paths. This measure is then applied to semi-supervised classification problems on medium-size networks and compared to state-of-the-art techniques.The second part introduces three novel algorithms for within-network classification in large-scale networks, i.e. classification of nodes in partially labeled graphs. The algorithms have a linear computing time in the number of edges, classes and steps and hence can be applied to large scale networks. They obtained competitive results in comparison to state-of-the-art technics on the large scale U.S.~patents citation network and on eight other data sets. Furthermore, during the thesis, we collected a novel benchmark data set: the U.S.~patents citation network. This data set is now available to the community for benchmarks purposes. The final part of the thesis concerns the combination of a citation graph with information on its nodes. We show that citation-based data provide better results for classification than content-based data. We also show empirically that combining both sources of information (content-based and citation-based) should be considered when facing a text categorization problem. For instance, while classifying journal papers, considering to extract an external citation graph may considerably boost the performance. However, in another context, when we have to directly classify the network citation nodes, then the help of features on nodes will not improve the results.The theory, algorithms and applications presented in this thesis provide interesting perspectives in various fields.Doctorat en Sciencesinfo:eu-repo/semantics/nonPublishe

    Novel measures on directed graphs and applications to large-scale within-network classification

    No full text
    Ces dernières années, les réseaux sont devenus une source importante d’informations dans différents domaines aussi variés que les sciences sociales, la physique ou les mathématiques. De plus, la taille de ces réseaux n’a cessé de grandir de manière conséquente. Ce constat a vu émerger de nouveaux défis, comme le besoin de mesures précises et intuitives pour caractériser et analyser ces réseaux de grandes tailles en un temps raisonnable.La première partie de cette thèse introduit une nouvelle mesure de similarité entre deux noeuds d’un réseau dirigé et pondéré :la covariance “sum-over-paths”. Celle-ci a une interprétation claire et précise :en dénombrant tous les chemins possibles deux noeuds sont considérés comme fortement corrélés s’ils apparaissent souvent sur un même chemin – de préférence court. Cette mesure dépend d’une distribution de probabilités, définie sur l’ensemble infini dénombrable des chemins dans le graphe, obtenue en minimisant l'espérance du coût total entre toutes les paires de noeuds du graphe sachant que l'entropie relative totale injectée dans le réseau est fixée à priori. Le paramètre d’entropie permet de biaiser la distribution de probabilité sur un large spectre :allant de marches aléatoires naturelles où tous les chemins sont équiprobables à des marches biaisées en faveur des plus courts chemins. Cette mesure est alors appliquée à des problèmes de classification semi-supervisée sur des réseaux de taille moyennes et comparée à l’état de l’art.La seconde partie de la thèse introduit trois nouveaux algorithmes de classification de noeuds en sein d’un large réseau dont les noeuds sont partiellement étiquetés. Ces algorithmes ont un temps de calcul linéaire en le nombre de noeuds, de classes et d’itérations, et peuvent dés lors être appliqués sur de larges réseaux. Ceux-ci ont obtenus des résultats compétitifs en comparaison à l’état de l’art sur le large réseaux de citations de brevets américains et sur huit autres jeux de données. De plus, durant la thèse, nous avons collecté un nouveau jeu de données, déjà mentionné :le réseau de citations de brevets américains. Ce jeu de données est maintenant disponible pour la communauté pour la réalisation de tests comparatifs.La partie finale de cette thèse concerne la combinaison d’un graphe de citations avec les informations présentes sur ses noeuds. De manière empirique, nous avons montré que des données basées sur des citations fournissent de meilleurs résultats de classification que des données basées sur des contenus textuels. Toujours de manière empirique, nous avons également montré que combiner les différentes sources d’informations (contenu et citations) doit être considéré lors d’une tâche de classification de textes. Par exemple, lorsqu’il s’agit de catégoriser des articles de revues, s’aider d’un graphe de citations extrait au préalable peut améliorer considérablement les performances. Par contre, dans un autre contexte, quand il s’agit de directement classer les noeuds du réseau de citations, s’aider des informations présentes sur les noeuds n’améliora pas nécessairement les performances.La théorie, les algorithmes et les applications présentés dans cette thèse fournissent des perspectives intéressantes dans différents domaines.In recent years, networks have become a major data source in various fields ranging from social sciences to mathematical and physical sciences. Moreover, the size of available networks has grow substantially as well. This has brought with it a number of new challenges, like the need for precise and intuitive measures to characterize and analyze large scale networks in a reasonable time. The first part of this thesis introduces a novel measure between two nodes of a weighted directed graph: The sum-over-paths covariance. It has a clear and intuitive interpretation: two nodes are considered as highly correlated if they often co-occur on the same -- preferably short -- paths. This measure depends on a probability distribution over the (usually infinite) countable set of paths through the graph which is obtained by minimizing the total expected cost between all pairs of nodes while fixing the total relative entropy spread in the graph. The entropy parameter allows to bias the probability distribution over a wide spectrum: going from natural random walks (where all paths are equiprobable) to walks biased towards shortest-paths. This measure is then applied to semi-supervised classification problems on medium-size networks and compared to state-of-the-art techniques.The second part introduces three novel algorithms for within-network classification in large-scale networks, i.e. classification of nodes in partially labeled graphs. The algorithms have a linear computing time in the number of edges, classes and steps and hence can be applied to large scale networks. They obtained competitive results in comparison to state-of-the-art technics on the large scale U.S.~patents citation network and on eight other data sets. Furthermore, during the thesis, we collected a novel benchmark data set: the U.S.~patents citation network. This data set is now available to the community for benchmarks purposes. The final part of the thesis concerns the combination of a citation graph with information on its nodes. We show that citation-based data provide better results for classification than content-based data. We also show empirically that combining both sources of information (content-based and citation-based) should be considered when facing a text categorization problem. For instance, while classifying journal papers, considering to extract an external citation graph may considerably boost the performance. However, in another context, when we have to directly classify the network citation nodes, then the help of features on nodes will not improve the results.The theory, algorithms and applications presented in this thesis provide interesting perspectives in various fields.Doctorat en Sciencesinfo:eu-repo/semantics/nonPublishe

    Item Cold-Start Recommendations: Learning Local Collective Embeddings

    No full text
    ABSTRACT Recommender systems suggest to users items that they might like (e.g., news articles, songs, movies) and, in doing so, they help users deal with information overload and enjoy a personalized experience. One of the main problems of these systems is the item cold-start, i.e., when a new item is introduced in the system and no past information is available, then no effective recommendations can be produced. The item cold-start is a very common problem in practice: modern online platforms have hundreds of new items published every day. To address this problem, we propose to learn Local Collective Embeddings: a matrix factorization that exploits items' properties and past user preferences while enforcing the manifold structure exhibited by the collective embeddings. We present a learning algorithm based on multiplicative update rules that are efficient and easy to implement. The experimental results on two item cold-start use cases: news recommendation and email recipient recommendation, demonstrate the effectiveness of this approach and show that it significantly outperforms six state-of-theart methods for item cold-start

    Demonstrations track chairs' welcome

    No full text
    corecore