24 research outputs found
Google matrix analysis of DNA sequences
For DNA sequences of various species we construct the Google matrix G of
Markov transitions between nearby words composed of several letters. The
statistical distribution of matrix elements of this matrix is shown to be
described by a power law with the exponent being close to those of outgoing
links in such scale-free networks as the World Wide Web (WWW). At the same time
the sum of ingoing matrix elements is characterized by the exponent being
significantly larger than those typical for WWW networks. This results in a
slow algebraic decay of the PageRank probability determined by the distribution
of ingoing elements. The spectrum of G is characterized by a large gap leading
to a rapid relaxation process on the DNA sequence networks. We introduce the
PageRank proximity correlator between different species which determines their
statistical similarity from the view point of Markov chains. The properties of
other eigenstates of the Google matrix are also discussed. Our results
establish scale-free features of DNA sequence networks showing their
similarities and distinctions with the WWW and linguistic networks.Comment: latex, 11 fig
Application of the Google matrix methods for characterization of directed networks
La théorie des réseaux complexes est un domaine récent et important de la recherche qui consiste étudier divers systèmes naturels ou artificiels d'un point de vue des graphes en considérant une collection d'objets interdépendants. Parmi les différents aspects de la théorie des réseaux complexes, cette thèse se concentre sur l'analyse des propriétés structurelles des réseaux dirigés.
L'outil principal utilisé dans ce travail est la méthode de la matrice Google qui est une méthode dérivée de la théorie des chaînes de Markov. La construction de cette matrice et son lien avec les chaînes de Markov sont expliqués dans le second chapitre et les propriétés spectrales des valeurs propres y sont également discutées. L'accent est mis sur le vecteur propre principal dela matrice (le PageRank). La base du système de ranking donné par le Page Rank y est expliquée en détail et illustrée à travers plusieurs exemples dans les chapitres suivants. Les systèmes considérés ici sont: les séquences d'ADN de quelques espèces animales,le système nerveux du vers C.elegans ainsi que l'antique jeu de stratégie sur plateau, le jeu de go. Dans le premier cas nous analysons les propriétés statistiques des chaînes symboliques sous le point de vue des réseaux dirigés et nous proposons une mesure simple de similarité entre les espèces basée sur le PageRank. Dans le second cas nous introduisons le concept du ranking complémentaire (le CheiRank) permettant de caractériser en deux dimensions les réseaux dirigés. Dans le troisième cas nous utilisons les vecteurs propres principaux pour mettre en évidence les coups importants joués lors d'une partie de Go et nous montrons que les vecteurs propres suivants peuvent contenir des informations de communautés de coups. Ces diverses applications montrent que l'information apportée par le PageRank peut s'avérer utile dans de nombreuses situations différentes affin d'obtenir un aperçu du problème sous un angle différent, qui est l'approche des réseaux dirigés, enrichissant ainsi notre compréhension des systèmes étudiés.The complex network theory is a recent field of great importance to study various systems under a graph perspective by considering a collection of interdependent objects. Among the different aspects of the complex networks, this thesis is focused on the analysis of structural properties of directed networks. The primary tool used in this work is the Google matrix method which is derived from the Markov chain theory. The construction of this matrix and its link with Markov chains are explored and the spectral properties of the eigenvalues are discussed with an emphasis on the dominant eigenvalue with its associated eigenvector(PageRank vector). The ranking system given by the PageRank is explained in detail and illustrated through several examples. The systems considered here are the DNA sequences of some animal species, the neural system of the C.elegans worm and the ancient strategy board game : the game of Go. In the first case, the statistical properties of symbolic chains are analyzed through a directed network viewpoint and a similarity measure of species based on PageRank is proposed. In the second case, the complementary ranking system (CheiRank vector) is introduced to provide a two dimensional characterization of the directed networks. In the third case, the dominant eigenvectors are used to highlight the most important moves during a game of Go and it is shown that those eigenvectors contain more information than mere frequency counts of the moves. It is also discussed that eigenvectors other than the dominant ones might contain information about some community structures of moves. These applications show how the information brought by the PageRank can be useful in various situations to gain some interesting or original insight about the studied system and how it is helping to understand the organization of the underlying directed network
PageRank model of opinion formation on social networks
We propose the PageRank model of opinion formation and investigate its rich
properties on real directed networks of Universities of Cambridge and Oxford,
LiveJournal and Twitter. In this model the opinion formation of linked electors
is weighted with their PageRank probability. We find that the society elite,
corresponding to the top PageRank nodes, can impose its opinion to a
significant fraction of the society. However, for a homogeneous distribution of
two opinions there exists a bistability range of opinions which depends on a
conformist parameter characterizing the opinion formation. We find that
LiveJournal and Twitter networks have a stronger tendency to a totalitar
opinion formation. We also analyze the Sznajd model generalized for scale-free
networks with the weighted PageRank vote of electors.Comment: revtex 10 pages, 16 figs, research at
http://www.quantware.ups-tlse.fr
Application des méthodes de la matrice Google à la caractérisation des réseaux dirigés
The complex network theory is a recent field of great importance to study various systems under a graph perspective by considering a collection of interdependent objects. Among the different aspects of the complex networks, this thesis is focused on the analysis of structural properties of directed networks. The primary tool used in this work is the Google matrix method which is derived from the Markov chain theory.The construction of this matrix and its link with Markov chains are explored and the spectral properties of the eigenvalues are discussed with an emphasis on the dominant eigenvalue with its associated eigenvector (PageRank vector). The ranking system given by the PageRank is explained in detail and illustrated through several examples.The systems considered here are the DNA sequences of some animal species, the neural system of the \emph{C.elegans} worm and the ancient strategy board game : the game of Go. In the first case, the statistical properties of symbolic chains are analyzed through a directed network viewpoint and a similarity measure of species based on PageRank is proposed. In the second case, the complementary ranking system (CheiRank vector) is introduced to provide a two dimensional characterization of the directed networks. In the third case, the dominant eigenvectors are used to highlight the most important moves during a game of Go and it is shown that those eigenvectors contain more information than mere frequency counts of the moves. It is also discussed that eigenvectors other than the dominant ones might contain information about some community structures of moves. These applications show how the information brought by the PageRank can be useful in various situations to gain some interesting or original insight about the studied system and how it is helping to understand the organization of the underlying directed network.La théorie des réseaux complexes est un domaine récent et important de la recherche qui consiste à étudier divers systèmes naturels ou artificiels d'un point de vue des graphes en considérant une collection d'objets interdépendants. Parmi les différents aspects de la théorie des réseaux complexes, cette thèse se concentre sur l'analyse des propriétés structurelles des réseaux dirigés. L'outil principal utilisé dans ce travail est la méthode de la matrice Google qui est une méthode dérivée de la théorie des chaînes de Markov.La construction de cette matrice et son lien avec les chaînes de Markov sont expliqués dans le second chapitre et les propriétés spectrales des valeurs propres y sont également discutées. L'accent est mis sur le vecteur propre principal de la matrice (le PageRank). La base du système de ranking donné par le PageRank y est expliquée en détail et illustrée à travers plusieurs exemples dans les chapitres suivants. Les systèmes considérés ici sont : les séquences d'ADN de quelques espèces animales, le système nerveux du vers \emph{C.elegans} ainsi que l'antique jeu de stratégie sur plateau, le jeu de go. Dans le premier cas nous analysons les propriétés statistiques des chaînes symboliques sous le point de vue des réseaux dirigés et nous proposons une mesure simple de similarité entre les espèces basée sur le PageRank. Dans le second cas nous introduisons le concept du ranking complémentaire (le CheiRank) permettant de caractériser en deux dimensions les réseaux dirigés. Dans le troisième cas nous utilisons les vecteurs propres principaux pour mettre en évidence les coups importants joués lors d'une partie de Go et nous montrons que les vecteurs propres suivants peuvent contenir des informations de communautés de coups. Ces diverses applications montrent que l'information apportée par le PageRank peut s'avérer utile dans de nombreuses situations différentes afin d'obtenir un aperçu du problème sous un angle différent, qui est l'approche des réseaux dirigés, enrichissant ainsi notre compréhension des systèmes étudiés
PageRank proximity diagram of Homo sapiens versus Homo sapiens at (see text for details).
<p>Top panels show the content of (left) and (right) in the same way as in <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g008" target="_blank">Fig. 8</a> and <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g007" target="_blank">Fig. 7</a> respectively. Bottom panels show zoom of top panels.</p
Same as in Fig. 7 but now the color marks the fraction of of letters or in any order in a word with red at maximal content and blue at zero content.
<p>Same as in <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g007" target="_blank">Fig. 7</a> but now the color marks the fraction of of letters or in any order in a word with red at maximal content and blue at zero content.</p
Zoom of the PageRank proximity diagram of Fig. 8 for the range with the same color for or content.
<p>Zoom of the PageRank proximity diagram of <a href="http://www.plosone.org/article/info:doi/10.1371/journal.pone.0061519#pone-0061519-g008" target="_blank">Fig. 8</a> for the range with the same color for or content.</p
Spectrum of eigenvalues in the complex plane for DNA Google matrix of Homo sapiens (HS) shown for words of letters (from top to bottom).
<p>Spectrum of eigenvalues in the complex plane for DNA Google matrix of Homo sapiens (HS) shown for words of letters (from top to bottom).</p