24 research outputs found

    Google matrix analysis of DNA sequences

    Get PDF
    For DNA sequences of various species we construct the Google matrix G of Markov transitions between nearby words composed of several letters. The statistical distribution of matrix elements of this matrix is shown to be described by a power law with the exponent being close to those of outgoing links in such scale-free networks as the World Wide Web (WWW). At the same time the sum of ingoing matrix elements is characterized by the exponent being significantly larger than those typical for WWW networks. This results in a slow algebraic decay of the PageRank probability determined by the distribution of ingoing elements. The spectrum of G is characterized by a large gap leading to a rapid relaxation process on the DNA sequence networks. We introduce the PageRank proximity correlator between different species which determines their statistical similarity from the view point of Markov chains. The properties of other eigenstates of the Google matrix are also discussed. Our results establish scale-free features of DNA sequence networks showing their similarities and distinctions with the WWW and linguistic networks.Comment: latex, 11 fig

    Application of the Google matrix methods for characterization of directed networks

    Get PDF
    La théorie des réseaux complexes est un domaine récent et important de la recherche qui consiste étudier divers systèmes naturels ou artificiels d'un point de vue des graphes en considérant une collection d'objets interdépendants. Parmi les différents aspects de la théorie des réseaux complexes, cette thèse se concentre sur l'analyse des propriétés structurelles des réseaux dirigés. L'outil principal utilisé dans ce travail est la méthode de la matrice Google qui est une méthode dérivée de la théorie des chaînes de Markov. La construction de cette matrice et son lien avec les chaînes de Markov sont expliqués dans le second chapitre et les propriétés spectrales des valeurs propres y sont également discutées. L'accent est mis sur le vecteur propre principal dela matrice (le PageRank). La base du système de ranking donné par le Page Rank y est expliquée en détail et illustrée à travers plusieurs exemples dans les chapitres suivants. Les systèmes considérés ici sont: les séquences d'ADN de quelques espèces animales,le système nerveux du vers C.elegans ainsi que l'antique jeu de stratégie sur plateau, le jeu de go. Dans le premier cas nous analysons les propriétés statistiques des chaînes symboliques sous le point de vue des réseaux dirigés et nous proposons une mesure simple de similarité entre les espèces basée sur le PageRank. Dans le second cas nous introduisons le concept du ranking complémentaire (le CheiRank) permettant de caractériser en deux dimensions les réseaux dirigés. Dans le troisième cas nous utilisons les vecteurs propres principaux pour mettre en évidence les coups importants joués lors d'une partie de Go et nous montrons que les vecteurs propres suivants peuvent contenir des informations de communautés de coups. Ces diverses applications montrent que l'information apportée par le PageRank peut s'avérer utile dans de nombreuses situations différentes affin d'obtenir un aperçu du problème sous un angle différent, qui est l'approche des réseaux dirigés, enrichissant ainsi notre compréhension des systèmes étudiés.The complex network theory is a recent field of great importance to study various systems under a graph perspective by considering a collection of interdependent objects. Among the different aspects of the complex networks, this thesis is focused on the analysis of structural properties of directed networks. The primary tool used in this work is the Google matrix method which is derived from the Markov chain theory. The construction of this matrix and its link with Markov chains are explored and the spectral properties of the eigenvalues are discussed with an emphasis on the dominant eigenvalue with its associated eigenvector(PageRank vector). The ranking system given by the PageRank is explained in detail and illustrated through several examples. The systems considered here are the DNA sequences of some animal species, the neural system of the C.elegans worm and the ancient strategy board game : the game of Go. In the first case, the statistical properties of symbolic chains are analyzed through a directed network viewpoint and a similarity measure of species based on PageRank is proposed. In the second case, the complementary ranking system (CheiRank vector) is introduced to provide a two dimensional characterization of the directed networks. In the third case, the dominant eigenvectors are used to highlight the most important moves during a game of Go and it is shown that those eigenvectors contain more information than mere frequency counts of the moves. It is also discussed that eigenvectors other than the dominant ones might contain information about some community structures of moves. These applications show how the information brought by the PageRank can be useful in various situations to gain some interesting or original insight about the studied system and how it is helping to understand the organization of the underlying directed network

    PageRank model of opinion formation on social networks

    Full text link
    We propose the PageRank model of opinion formation and investigate its rich properties on real directed networks of Universities of Cambridge and Oxford, LiveJournal and Twitter. In this model the opinion formation of linked electors is weighted with their PageRank probability. We find that the society elite, corresponding to the top PageRank nodes, can impose its opinion to a significant fraction of the society. However, for a homogeneous distribution of two opinions there exists a bistability range of opinions which depends on a conformist parameter characterizing the opinion formation. We find that LiveJournal and Twitter networks have a stronger tendency to a totalitar opinion formation. We also analyze the Sznajd model generalized for scale-free networks with the weighted PageRank vote of electors.Comment: revtex 10 pages, 16 figs, research at http://www.quantware.ups-tlse.fr

    Application des méthodes de la matrice Google à la caractérisation des réseaux dirigés

    No full text
    The complex network theory is a recent field of great importance to study various systems under a graph perspective by considering a collection of interdependent objects. Among the different aspects of the complex networks, this thesis is focused on the analysis of structural properties of directed networks. The primary tool used in this work is the Google matrix method which is derived from the Markov chain theory.The construction of this matrix and its link with Markov chains are explored and the spectral properties of the eigenvalues are discussed with an emphasis on the dominant eigenvalue with its associated eigenvector (PageRank vector). The ranking system given by the PageRank is explained in detail and illustrated through several examples.The systems considered here are the DNA sequences of some animal species, the neural system of the \emph{C.elegans} worm and the ancient strategy board game : the game of Go. In the first case, the statistical properties of symbolic chains are analyzed through a directed network viewpoint and a similarity measure of species based on PageRank is proposed. In the second case, the complementary ranking system (CheiRank vector) is introduced to provide a two dimensional characterization of the directed networks. In the third case, the dominant eigenvectors are used to highlight the most important moves during a game of Go and it is shown that those eigenvectors contain more information than mere frequency counts of the moves. It is also discussed that eigenvectors other than the dominant ones might contain information about some community structures of moves. These applications show how the information brought by the PageRank can be useful in various situations to gain some interesting or original insight about the studied system and how it is helping to understand the organization of the underlying directed network.La théorie des réseaux complexes est un domaine récent et important de la recherche qui consiste à étudier divers systèmes naturels ou artificiels d'un point de vue des graphes en considérant une collection d'objets interdépendants. Parmi les différents aspects de la théorie des réseaux complexes, cette thèse se concentre sur l'analyse des propriétés structurelles des réseaux dirigés. L'outil principal utilisé dans ce travail est la méthode de la matrice Google qui est une méthode dérivée de la théorie des chaînes de Markov.La construction de cette matrice et son lien avec les chaînes de Markov sont expliqués dans le second chapitre et les propriétés spectrales des valeurs propres y sont également discutées. L'accent est mis sur le vecteur propre principal de la matrice (le PageRank). La base du système de ranking donné par le PageRank y est expliquée en détail et illustrée à travers plusieurs exemples dans les chapitres suivants. Les systèmes considérés ici sont : les séquences d'ADN de quelques espèces animales, le système nerveux du vers \emph{C.elegans} ainsi que l'antique jeu de stratégie sur plateau, le jeu de go. Dans le premier cas nous analysons les propriétés statistiques des chaînes symboliques sous le point de vue des réseaux dirigés et nous proposons une mesure simple de similarité entre les espèces basée sur le PageRank. Dans le second cas nous introduisons le concept du ranking complémentaire (le CheiRank) permettant de caractériser en deux dimensions les réseaux dirigés. Dans le troisième cas nous utilisons les vecteurs propres principaux pour mettre en évidence les coups importants joués lors d'une partie de Go et nous montrons que les vecteurs propres suivants peuvent contenir des informations de communautés de coups. Ces diverses applications montrent que l'information apportée par le PageRank peut s'avérer utile dans de nombreuses situations différentes afin d'obtenir un aperçu du problème sous un angle différent, qui est l'approche des réseaux dirigés, enrichissant ainsi notre compréhension des systèmes étudiés

    PageRank proximity diagram of Homo sapiens versus Homo sapiens at (see text for details).

    No full text
    <p>Top panels show the content of (left) and (right) in the same way as in <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g008" target="_blank">Fig. 8</a> and <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g007" target="_blank">Fig. 7</a> respectively. Bottom panels show zoom of top panels.</p

    Same as in Fig. 7 but now the color marks the fraction of of letters or in any order in a word with red at maximal content and blue at zero content.

    No full text
    <p>Same as in <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g007" target="_blank">Fig. 7</a> but now the color marks the fraction of of letters or in any order in a word with red at maximal content and blue at zero content.</p

    Zoom of the PageRank proximity diagram of Fig. 8 for the range with the same color for or content.

    No full text
    <p>Zoom of the PageRank proximity diagram of <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g008" target="_blank">Fig. 8</a> for the range with the same color for or content.</p

    Spectrum of eigenvalues in the complex plane for DNA Google matrix of Homo sapiens (HS) shown for words of letters (from top to bottom).

    No full text
    <p>Spectrum of eigenvalues in the complex plane for DNA Google matrix of Homo sapiens (HS) shown for words of letters (from top to bottom).</p
    corecore