11 research outputs found

    Classification of Message Spreading in a Heterogeneous Social Network

    Get PDF
    Nowadays, social networks such as Twitter, Facebook and LinkedIn become increasingly popular. In fact, they introduced new habits, new ways of communication and they collect every day several information that have different sources. Most existing research works fo-cus on the analysis of homogeneous social networks, i.e. we have a single type of node and link in the network. However, in the real world, social networks offer several types of nodes and links. Hence, with a view to preserve as much information as possible, it is important to consider so-cial networks as heterogeneous and uncertain. The goal of our paper is to classify the social message based on its spreading in the network and the theory of belief functions. The proposed classifier interprets the spread of messages on the network, crossed paths and types of links. We tested our classifier on a real word network that we collected from Twitter, and our experiments show the performance of our belief classifier

    Influence Maximization with Bandits

    Full text link
    We consider the problem of \emph{influence maximization}, the problem of maximizing the number of people that become aware of a product by finding the `best' set of `seed' users to expose the product to. Most prior work on this topic assumes that we know the probability of each user influencing each other user, or we have data that lets us estimate these influences. However, this information is typically not initially available or is difficult to obtain. To avoid this assumption, we adopt a combinatorial multi-armed bandit paradigm that estimates the influence probabilities as we sequentially try different seed sets. We establish bounds on the performance of this procedure under the existing edge-level feedback as well as a novel and more realistic node-level feedback. Beyond our theoretical results, we describe a practical implementation and experimentally demonstrate its efficiency and effectiveness on four real datasets.Comment: 12 page

    Modelado de la difusión de información en Twitter

    Full text link
    La llegada de las redes sociales en línea ha traído consigo una revolución en la difusión de información. Comparado con los medios de comunicación tradicionales centralizados en unas pocas manos, con unos grandes canales radiales de transmisión, las redes se caracterizan por la capacidad de expandir información en oleadas a partir de un pequeño origen en cualquier punto de la red, llegando a un gran número de receptores en muy poco tiempo. Este fenómeno se ha convertido en objeto de estudio por su gran impacto en la sociedad. En este Trabajo de Fin de Grado se investiga, en el campo de difusión de información en redes sociales, la estructura de cascada de los posibles caminos que ha seguido la información en su propagación por la red. El trabajo experimental del TFG se basa en datos de la plataforma social Twitter, cuyo objetivo es la publicación de tweets, pequeñas piezas de información, que otros usuarios pueden recibir y retransmitir a otros; un formato que resulta muy adecuado en este estudio. En una primera fase se realiza una captura de datos de Twitter y se recrean los caminos posibles seguidos por la información en forma de cascadas para, posteriormente, ser analizadas con métricas de caracterización de grafos. En este análisis se estudian las distribuciones de los valores aportados por las métricas para obtener información de la topología y propiedades de estos caminos seguidos por la información. En una segunda fase del trabajo, se estudiarán diferentes modelos de influencia, cuyo objetivo es refinar las cascadas de información escogiendo el camino más plausible de entre todos los posibles, según las hipótesis de cada modelo. Cada modelo representa la influencia que ejercen unos usuarios sobre otros en este proceso de propagación basándose en distintos criterios. En este trabajo se intenta concluir cuál de ellos se aproxima más a lo que ocurre en la realidad. Para ello, se empleará un método de simulación de propagación de tweets, que permite realizar comparaciones y análisis para obtener datos que lleven al objetivo de esta fase

    An Approach to Twitter Event Detection Using the Newsworthiness Metric

    Get PDF

    Diffusion de l'information dans les réseaux sociaux

    Get PDF
    Predicting the diffusion of information in social networks is a key problem for applications like Opinion Leader Detection, Buzz Detection or Viral Marketing. Many recent diffusion models are direct extensions of the Cascade and Threshold models, initially proposed for epidemiology and social studies. In such models, the diffusion process is based on the dynamics of interactions between neighbor nodes in the network (the social pressure), and largely ignores important dimensions as the content diffused and the active/passive role users tend to have in social networks. We propose here a new family of models that aims at predicting how a content diffuses in a network by making use of additional dimensions : the content diffused, user's profile and willingness to diffuse. In particular, we show how to integrate these dimensions into simple feature functions, and propose a probabilistic modeling to account for the diffusion process. These models are then illustrated and compared with other approaches on two blog datasets. The experimental results obtained on these datasets show that taking into account these dimensions are important to accurately model the diffusion process. Lastly, we study the influence maximization problem with these models and prove that it is NP-hard, prior to propose an adaptation of the greedy algorithm to approximate the optimal solution.Prédire la diffusion de l'information dans les réseaux sociaux est une tâche difficile qui peut cependant permettre de répondre à des problèmes intéressants : recommandation d'information, choix des meilleurs points d'entrée pour une diffusion, etc. La plupart des modèles proposés récemment sont des extensions des modèles à cascades et de seuil. Dans ces modèles, le processus de diffusion est basé sur les interactions entre les utilisateurs du réseau (la pression sociale), et ignore des caractéristiques importantes comme le contenu de l'information diffusé ou le rôle actif/passif des utilisateurs. Nous proposons une nouvelle famille de modèles pour prédire la façon dont le contenu se diffuse dans un réseau en prenant en compte ces nouvelles caractéristiques : le contenu diffusé, le profil des utilisateurs et leur tendance à diffuser. Nous montrons comment combiner ces caractéristiques et proposons une modélisation probabiliste pour résoudre le problème de la diffusion. Ces modèles sont illustrés et comparés avec d'autres approches sur deux jeux de données de blogs. Les résultats obtenus sur ces jeux de données montrent que prendre en compte ces caractéristiques est important pour modéliser le processus de diffusion. Enfin, nous étudions le problème de maximisation de l'influence avec ces modèles et prouvons qu'il est NP-difficile, avant de proposer une adaptation d'un algorithme glouton pour approcher la solution optimale
    corecore