10 research outputs found

    Détection de communautés dans les réseaux d'information utilisant liens et attributs

    Get PDF
    Alors que les réseaux sociaux s'attachent à représenter des entités et les relations existant entre elles, les réseaux d'information intègrent également des attributs décrivant ces entités ; ce qui conduit à revisiter les méthodes d'analyse et de fouille de ces réseaux. Dans ces travaux, nous proposons des méthodes de classification des entités du réseau d'information qui exploitent d'une part les relations entre celles-ci et d'autre part les attributs les caractérisant. Nous nous penchons sur le cas des réseaux à vecteurs d'attributs, où les entités du réseau sont décrites par des vecteurs numériques. Ainsi nous proposons des approches basées sur des techniques reconnues pour chaque type d'information, faisant appel notamment à l'inertie pour la classification automatique et à la modularité de Newman et Girvan pour la détection de communautés. Nous évaluons nos propositions sur des réseaux issus de données bibliographiques, faisant usage en particulier d'information textuelle. Nous évaluons également nos approches face à diverses évolutions du réseau, notamment au regard d'une détérioration des informations des liens et des attributs, et nous caractérisons la robustesse de nos méthodes à celle-ciWhile social networks use to represent entities and relationships between them, information networks also include attributes describing these entities, leading to review the analysis and mining methods for these networks. In this work, we discuss classification of the entities in an information network. Classification operate simultaneously on the relationships and on the attributes characterizing the entities. We look at the case of attributed graphs where entities are described by numerical feature vectors. We propose approaches based on proven classification techniques for each type of information, including the inertia for machine learning and Newman and Girvan's modularity for community detection. We evaluate our proposals on networks from bibliographic data, using textual information. We also evaluate our methods against various changes in the network, such as a deterioration of the relational or vector data, mesuring the robustness of our methods to themST ETIENNE-Bib. électronique (422189901) / SudocSudocFranceF

    Découverte et analyse des communautés implicites par une approche sémantique en ligne (l'outil WebTribe)

    Get PDF
    Avec l essor du Web 2.0 et des technologies collaboratives qui y sont rattachées,le Web est aujourd hui devenu une vaste plate-forme d échanges entre internautes.La majeure partie des sites Web sont actuellement soit dédiés aux interactionssociales de leurs utilisateurs, soit proposent des outils pour développer ces interactions.Nos travaux portent sur la compréhension de ces échanges, ainsi que desstructures communautaires qui en découlent, au moyen d une approche sémantique.Pour répondre aux besoins de compréhension propres aux analystes de siteWeb et autres gestionnaires de communautés, nous analysons ces structures communautairespour en extraire des caractéristiques essentielles comme leurs centresthématiques et contributeurs centraux. Notre analyse sémantique s appuie notammentsur des ontologies légères de référence pour définir plusieurs nouvelles métriques,comme la centralité sémantique temporelle et la probabilité de propagationsémantique. Nous employons une approche en ligne afin de suivre l activitéutilisateur en temps réel, au sein de notre outil d analyse communautaire Web-Tribe. Nous avons implémenté et testé nos méthodes sur des données extraites desystèmes réels de communication sociale sur le WebWith the rise of Web 2.0 and collaborative technologies that are attached to,the Web has now become a broad platform of exchanges between users. The majorityof websites is now dedicated to social interactions of their users, or offerstools to develop these interactions. Our work focuses on the understanding of theseexchanges, as well as emerging community structures arising, through a semanticapproach. To meet the needs of web analysts, we analyze these community structuresto identify their essential characteristics as their thematic centers and centralcontributors. Our semantic analysis is mainly based on reference light ontologiesto define several new metrics such as the temporal semantic centrality and thesemantic propagation probability. We employ an online approach to monitor useractivity in real time in our community analysis tool WebTribe. We have implementedand tested our methods on real data from social communication systemson the WebDIJON-BU Doc.électronique (212319901) / SudocSudocFranceF

    Analyse du capitalisme social sur Twitter

    Get PDF
    Bourdieu, a sociologist, defines social capital as : "The set of current or po-tential ressources linked to the possession of a lasting relationships network". On Twitter,the friends, followers, users mentionned and retweeted are considered as the relationshipsnetwork of each user, which ressources are the chance to get relevant information, to beread, to satisfy a narcissist need, to spread information or advertisements. We observethat some Twitter users that we call social capitalists aim to maximize their followernumbers to maximize their social capital. We introduce their methods, based on mutualsubscriptions and dedicated hashtags. In order to study them, we first describe a large-scale detection method based on their set of followers and followees. Then, we show withan automated Twitter account that their methods allow to gain followers and to be ret-weeted efficiently. Afterwards, we bring to light that social capitalists methods allowsthese users to occupy specific positions in the network allowing them a high visibility.Furthermore, these methods make these users influent according to the major tools. Wethus set up a classification method to detect accurately these user and produce a newinfluence score.Le sociologue Bourdieu définit le capital social comme : "L’ensemble des ressources actuelles ou potentielles qui sont liées à la possession d’un réseau durable de relations". Sur Twitter, les abonnements, mentions et retweets créent un réseau de relations pour chaque utilisateur dont les ressources sont l’obtention d’informations pertinentes, la possibilité d’être lu, d’assouvir un besoin narcissique, de diffuser efficacement des messages. Certains utilisateurs Twitter -appelés capitalistes sociaux- cherchent à maximiser leur nombre d’abonnements pour maximiser leur capital social. Nous introduisons leurs techniques, basées sur l’échange d’abonnements et l’utilisation de hashtags dédiés. Afin de mieux les étudier, nous détaillons tout d’abord une méthode pour détecter à l’échelle du réseau ces utilisateurs en se basant sur leurs abonnements et abonnés. Puis, nous montrons avec un compte Twitter automatisé que ces techniques permettent de gagner efficacement des abonnés et de se faire beaucoup retweeter. Nous établissons ensuite que ces dernières permettent également aux capitalistes sociaux d’occuper des positions qui leur accordent une bonne visibilité dans le réseau. De plus, ces méthodes rendent ces utilisateurs influents aux yeux des principaux outils de mesure. Nous présentons donc pour terminer une méthode de classification supervisée pour détecter avec précision ces utilisateurs et ainsi produire un nouveau score d’influence

    L'apport des données de contacts détaillées à la modélisation épidémiologique : application au cas des infections nosocomiales à Staphylococcus aureus

    Get PDF
    Mathematical modeling in epidemiology often assumes that individuals mix at random within a population. Age-structured models allow for more realistic contact rates, depending on the age of individuals, yet such models can’t characterize the heterogeneity at the individual level.In this thesis, we present the results of a prospective, longitudinal study conducted during 6 months in a long-term care facility located in Berck-sur-Mer, France. We show that high-resolution contact structures can be used to design new intervention strategies in order to reduce the spread of nosocomial bacteria and inform models with more realistic contact patterns.After first recalling the usual modeling frameworks used in epidemiology and their underlying hypothesis, we detail the data collected as part of the I-Bird study. This study focuses on understanding how Staphylococcus aureus spreads between individuals in a healthcare setting.In a first study, we provide empirical results that validate the use of electronic records as a good proxy for close-proximity interactions that can lead to the dissemination of S. aureus. We then set out to identify contact-related risk factors for S. aureus colonization, in an effort to detect situation of increased risk. Such situations could help enforce new intervention strategies that rely on the observed contact network, to efficiently reduce the burden of S. aureus, ultimately helping to reduce the spread of multidrug-resistant bacteria.La modélisation mathématique en épidémiologie utilise traditionnellement l’hypothèse de mélange homogène des individus dans la population. Si certains modèles structurés permettent de tenir compte de l’hétérogénéité apparente (spatiale, temporelle), ils permettent rarement de la caractériser à l’échelle d’un individu. Dans cette thèse, nous présentons les résultats de l’analyse conjointe des contacts interindividuels et du portage individuel de Staphylococcus aureus. Ces données, collectées dans l’hôpital de soins de suite de Berck-sur-Mer pendant 6 mois, permettent de mettre en évidence l’intérêt de l’étude des structures de contacts pour établir des nouvelles mesures de contrôle dans la lutte contre les infections nosocomiales, et plus généralement pour apporter un nouveau substrat informatif aux modèles épidémiologiques.Après avoir rappelé dans une première partie les différents modèles usuels utilisés en épidémiologie et les hypothèses qu’ils imposent, nous présentons l’étude I-Bird qui vise à identifier, par l’utilisation des nouvelles technologies de l’information, de nouvelles méthodes pour limiter la dissémination de bactéries nosocomiales.Dans une première étude, nous démontrons que l’utilisation de capteurs électroniques de proximité fournit un proxy valable pour la collecte des interactions interindividuelles pouvant mener à transmission de S. aureus entre patients et personnels soignants dans un établissement de soins de suite et de réadaptation. Nous exploitons ensuite ces données de façon à fournir une évaluation quantitative du risque individuel d’acquisition de S. aureus, dans l’optique de réduire la dissémination de bactéries multirésistantes

    Analyse de réseaux temporels par des méthodes de traitement du signal : application au système de vélos en libre-service à Lyon

    Get PDF
    Bike-sharing systems have become essential elements in urban transportation systems of many world's big cities. Thanks to the data generated by these systems, it is possible to obtain a precise characterization of urban cycling, both in terms of transportation and socio-economic aspects. Taking advantage of the recent abundance of data allowed by the current technology, the challenges lie in the development of efficient data analysis method, adapted to these systems. This PhD thesis proposes some answers to this issue, first by methodological developments and second by studying real-world data obtained from the bike-sharing system in Lyon, called Vélo'v.The Vélo'v system can be represented as a network, describing a set of relations between the stations spread over the city. This representation, used for many systems, enables the use of tools from network theory to measure the network structure and understand the underlying mechanisms. Nevertheless, taking into account the dynamic evolution of the structure requires an extension of the classical tools to the temporal case. Parallels between this problem and the field of signal processing can be done, and opens the way to the consideration of connections between the description of the dynamics of temporal networks and those of signals. This work introduces a duality between temporal networks and signals, such that the analysis of the signals using the classical tools of signal processing helps to the characterization of the structure of the corresponding network.This methodology, at the juncture between signal processing and network analysis, is first justified by the study of the Vélo'v network, by comparing different data analysis method and the representation of the system as a temporal network. Then, a method to relabel the vertices of the graph according to the topology of the network is discussed, opening up a duality between networks and signals. This duality is then extended to temporal networks: The analysis of the spectral properties of the signals are studied through a fully automated extraction method, enabling the decomposition of relevant network structure over time.Les systèmes de vélos en libre-service sont devenus des éléments indispensables dans les offres de transport urbain des grandes villes mondiales. À partir des données que ces systèmes génèrent, il est possible d'avoir une caractérisation fine de l'utilisation du vélo en milieu urbain, tant sur des problématiques traitant du domaine des transports que des aspects socio-économiques. Comme pour de nombreux domaines profitant de la récente abondance en données permises par les technologies actuelles de communication et de stockage de l'information, les enjeux actuels résident dans le développement de méthodes d'analyse de données efficaces et adaptées aux systèmes étudiés. Cette thèse se propose de répondre à cette problématique, à la fois par des développements méthodologiques et par une application à des données réelles issues du système de vélos en libre-service Vélo'v à Lyon.Le système Vélo'v peut se représenter sous la forme d'un réseau, décrivant un ensemble de relations entre les différentes stations. Cette représentation, valable également pour de nombreux systèmes, permet l'utilisation d'outils pour décrire la structure du réseau basés sur la théorie des graphes. Néanmoins, la prise en compte d'une dynamique temporelle dans l'évolution des systèmes nécessite d'étendre l'analyse à des réseaux temporels, dont la structure évolue au cours du temps. Le parallèle avec le domaine du traitement du signal, dont le but est l'analyse de signaux temporels, amène à considérer des connexions entre la description de l'évolution d'un réseau temporel et celle d'un signal. Ces travaux proposent de considérer une dualité entre les réseaux temporels et les signaux, de sorte que l'analyse dans le domaine des signaux, à l'aide des outils du traitement du signal, permet de caractériser le réseau temporel correspondant.Cette méthodologie, à la frontière entre le traitement du signal et l'analyse des réseaux, est tout d'abord justifiée par l'étude du système Vélo'v, en comparant différentes approches d'analyse de données et les apports de la représentation sous la forme de réseau temporel. Une méthode d'étiquetage des noeuds d'un graphe est ensuite discutée, permettant d'ouvrir la voie vers une dualité entre réseaux et signaux. Cette dualité est étendue aux réseaux temporels, pour lesquels une méthode d'extraction automatique des structures pertinentes au cours du temps est proposée, à travers la décomposition des signaux correspondants

    L'AIS : une donnée pour l'analyse des activités en mer

    Get PDF
    4 pages, session "Mer et littoral"International audienceCette contribution présente des éléments méthodologiques pour la description des activités humaines en mer dans une perspective d'aide à la gestion. Différentes procédures, combinant l'exploitation de bases de données spatio-temporelles issue de données AIS archivées à des analyses spatiales au sein d'un SIG, sont testées afin de caractériser le transport maritime en Mer d'Iroise (Bretagne, France) sur les plans spatiaux, temporels et quantitatifs au cours d'une année

    Reconstruction d'un système sociosémantique par apprentissage machine

    Get PDF
    L'objectif de recherche de cette thèse est la reconstruction par apprentissage machine du mécanisme sociocognitif à l'œuvre dans l'évolution d'un réseau sociosémantique. Cet objectif est basé sur l'hypothèse que la dynamique d'un réseau sociosémantique est déterminée par un mécanisme d'influence sociale basé sur des facteurs d'exposition sociale, de contagion sociale, de déférence et de mimétisme des semblables. Une méthode de fouille de données basée sur l'analyse des réseaux sociaux, la sémantique vectorielle et l'apprentissage machine est développée afin de reconstruire différents modèles de l'influence sociale permettant de prédire l'évolution d'un réseau sociosémantique. Ces modèles sont des arbres de décisions, des listes de règles, des forêts aléatoires et des modèles probabilistes naïfs. L'analyse de ces modèles prédictifs suggère que l'hypothèse de recherche est vraisemblable, mais que d'autres mécanismes sont également à l'œuvre dans le processus étudié.\ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : Réseau sociosémantique, apprentissage machine, réseau social, sémantique vectorielle, influence sociale

    Characterising and modeling the co-evolution of transportation networks and territories

    Full text link
    The identification of structuring effects of transportation infrastructure on territorial dynamics remains an open research problem. This issue is one of the aspects of approaches on complexity of territorial dynamics, within which territories and networks would be co-evolving. The aim of this thesis is to challenge this view on interactions between networks and territories, both at the conceptual and empirical level, by integrating them in simulation models of territorial systems.Comment: Doctoral dissertation (2017), Universit\'e Paris 7 Denis Diderot. Translated from French. Several papers compose this PhD thesis; overlap with: arXiv:{1605.08888, 1608.00840, 1608.05266, 1612.08504, 1706.07467, 1706.09244, 1708.06743, 1709.08684, 1712.00805, 1803.11457, 1804.09416, 1804.09430, 1805.05195, 1808.07282, 1809.00861, 1811.04270, 1812.01473, 1812.06008, 1908.02034, 2012.13367, 2102.13501, 2106.11996

    Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018

    Get PDF
    International audienc
    corecore