3 research outputs found
Visual Analytics Methods for Exploring Geographically Networked Phenomena
abstract: The connections between different entities define different kinds of networks, and many such networked phenomena are influenced by their underlying geographical relationships. By integrating network and geospatial analysis, the goal is to extract information about interaction topologies and the relationships to related geographical constructs. In the recent decades, much work has been done analyzing the dynamics of spatial networks; however, many challenges still remain in this field. First, the development of social media and transportation technologies has greatly reshaped the typologies of communications between different geographical regions. Second, the distance metrics used in spatial analysis should also be enriched with the underlying network information to develop accurate models.
Visual analytics provides methods for data exploration, pattern recognition, and knowledge discovery. However, despite the long history of geovisualizations and network visual analytics, little work has been done to develop visual analytics tools that focus specifically on geographically networked phenomena. This thesis develops a variety of visualization methods to present data values and geospatial network relationships, which enables users to interactively explore the data. Users can investigate the connections in both virtual networks and geospatial networks and the underlying geographical context can be used to improve knowledge discovery. The focus of this thesis is on social media analysis and geographical hotspots optimization. A framework is proposed for social network analysis to unveil the links between social media interactions and their underlying networked geospatial phenomena. This will be combined with a novel hotspot approach to improve hotspot identification and boundary detection with the networks extracted from urban infrastructure. Several real world problems have been analyzed using the proposed visual analytics frameworks. The primary studies and experiments show that visual analytics methods can help analysts explore such data from multiple perspectives and help the knowledge discovery process.Dissertation/ThesisDoctoral Dissertation Computer Science 201
Suivi des Communautés dans les Réseaux Sociaux Dynamiques
A social network is a social structure of people related to each other through a
common relationship or interest, and the process of investigating it through network
and graph theories is called social network analysis. In the last decade, modeling and
mining social networks have attracted more and more attention, many researchers
are seeking to reveal hidden patterns and their evolutions which can capture interactions
between people and groups of people, as well as the associated resources for
understanding their behavior.
In our research, we focused on finding and analyzing the evolution of communities
in dynamic social networks, which is also known as tracking communities over time.
To achieve this, a community-matching strategy is devised, each evolving community
will be characterized by a series of significant evolutionary communities. In the social
network analysis area, most of the authors just focus on detecting changes (critical
events like form, expand, merge, split, etc.) communities may undergo. And they
evaluate their algorithms by looking at the number of occurrences of critical events
during the whole time period, barely focus on tracking community itself.
Several methods for tracking communities have been proposed, most of which use
however a sequential approach to perform one-to-one community mapping, and the
communities are compared in terms of shared-nodes (mostly used Jaccard Coefficient
based similarity measure) at only consecutive timestamps. Such one-sided approaches
could lead us to a wrong direction of tracking which neglects the social positions of
community members and decreases the possibilities of finding the maximum potential
evolutions.
To alleviate the limitations mentioned above, we propose a new algorithm for
tracking communities. We adopted a two-stage process as follows: first independently
detecting communities at each snapshot, then performing many-to-many communitymatching
on the whole time period with a novel similarity measure to generate a
sequence to represent the evolution. The similarity measure we proposed is capable
of not only capturing shared-nodes proportion numerically (content similarity), but
also the importance of their common members (member quality), and time proximity
between communities when we match them. For the tracking strategy, we maximize
the pair-wise similarity over all selected matches, which allows for many-to-many
mappings between communities across different time steps. The matching is implemented
over the entire observation period. It means our method will be able to
maximize the potential evolutions we could find. To demonstrate the capacity of the
proposed approach to increase the accuracy of tracking, we performed experimental
studies.
We carried a comparative study between four existing approaches and our proposed
approach for tracking communities to clarify their strength and weakness. In
our analysis, we compare the algorithms separately in two main community sets: (1)
when groups of users do not overlap and (2) when the groups overlap. After communities
are extracted, we implement the five approaches with the same set-up (including
same similarity threshold selection method and evaluation criteria) on three different
testbeds, extracted from the DBLP, Autonomous System (AS) and Yelp datasets.
The community we can successfully tracked from each approach can lead us to a conclusion:
our approach is efficient enough to capture community evolutions over time,
and at the same time, has remarkably improved the accuracy of tracking.Un réseau social est une structure dans laquelle des personnes sont liées les
unes aux autres par le biais d’une relation ou d’un intérêt commun. Le processus
d’investigation des réseaux sociaux se basant sur la théorie des graphe et des réseaux
est appelée analyse des réseaux sociaux. Au cours de la dernière décennie, la modélisation
et le forage des réseaux sociaux ont attiré de plus en plus l’attention. De
nombreux chercheurs cherchent à révéler les schémas cachés et les évolutions de ces
réseaux, pouvant saisir les interactions entre personnes et groupes de personnes.
Dans notre recherche, nous nous sommes concentrés sur la recherche et l’analyse de
l’évolution des communautés dans les réseaux sociaux dynamiques, qui est également
connu comme le suivi des communautés au fil du temps. Pour ce faire, une stratégie
de correspondance entre les communautés est élaborée, chaque communauté en évolution
sera caractérisée par une série de communautés évolutives significatives. Dans
le domaine de l’analyse des réseaux sociaux, la plupart des auteurs se concentrent
uniquement sur la détection des changements (événements critiques comme la formation,
l’expansion, la fusion, la scission, etc.) que les communautés peuvent subir.
Et ils évaluent leurs algorithmes en regardant le nombre d’occurrences d’événements
critiques pendant toute la période de suivi, se concentrent à peine sur le
suivi de la communauté en elle-même. Plusieurs méthodes de suivi des communautés
ont été proposées, dont la plupart utilisent une approche séquentielle pour effectuer
une cartographie des communautés une-à -une, et les communautés sont comparées en
termes de noeuds partagés à des instants consécutifs (principalement avec la mesure
de similarité basée sur le coefficient Jaccard). De telles approches pourraient nous
conduire dans une mauvaise direction pour le suivi des communautés car elles négligent
les positions sociales des membres de la communauté et diminue les possibilités
de trouver les Ă©volutions potentielles.
Pour pallier les limitations mentionnées ci-dessus, nous proposons un nouvel algorithme
de suivi des communautés. Nous avons adopté un processus en deux étapes:
premièrement, détecter de manière indépendante les communautés à chaque instant,
puis effectuer des correspondances entre plusieurs communautés sur toute la période
de suivi avec une nouvelle mesure de similarité pour générer une séquence représentant l’évolution de celles-ci. La mesure de similarité que nous proposons est capable non
seulement de capturer numériquement la proportion des noeuds partagés (similarité
du contenu), mais aussi d’évaluer l’importance de leurs noeuds communs (qualité des
noeuds) et la proximité temporelle entre les communautés. Pour la stratégie de suivi,
nous maximisons la similarité par paire sur toutes les correspondances sélectionnées,
ce qui permet des correspondances plusieurs-à -plusieurs entre les communautés au
cours des différents instants. La mise en correspondance est miss en oeuvre sur toute
la période d’observation. Cela signifie que notre méthode sera capable d’optimiser
les évolutions potentielles que nous pourrions trouver. Pour démontrer la capacité de
l’approche proposée à augmenter la précision du suivi, nous avons réalisé des études
expérimentales.
Nous avons mené une étude comparative entre quatre approches existantes et
notre approche proposée pour le suivi des communautés afin de clarifier leurs forces et
leurs faiblesses. Dans notre analyse, nous comparons les algorithmes séparément dans
deux ensembles de communautés principaux: (1) lorsque les groupes de personnes ne
se chevauchent pas et (2) lorsque les groupes se chevauchent. Après extraction des
communautés, nous implémentons les cinq approches avec la même configuration (y
compris la même méthode de sélection des seuils de similarité et les mêmes critères
d’évaluation) sur trois bancs d’essai différents, extraits des bases de données DBLP,
Autonomous System (AS) et Yelp. Les communautés que nous pouvons suivre avec
succès à partir de chaque approche peut nous mener à une conclusion: notre approche
est suffisamment efficace pour capturer les évolutions des communautés au fil du
temps et, en même temps, améliore remarquablement la précision du suivi