33 research outputs found

    Recherche et représentation de communautés dans des grands graphes

    Get PDF
    15 pagesNational audienceThis paper deals with the analysis and the visualization of large graphs. Our interest in such a subject-matter is related to the fact that graphs are convenient widespread data structures. Indeed, this type of data can be encountered in a growing number of concrete problems: Web, information retrieval, social networks, biological interaction networks... Furthermore, the size of these graphs becomes increasingly large as the progression of the means for data gathering and storage steadily strengthens. This calls for new methods in graph analysis and visualization which are now important and dynamic research fields at the interface of many disciplines such as mathematics, statistics, computer science and sociology. In this paper, we propose a method for graphs representation and visualization based on a prior clustering of the vertices. Newman and Girvan (2004) points out that “reducing [the] level of complexity [of a network] to one that can be interpreted readily by the human eye, will be invaluable in helping us to understand the large-scale structure of these new network data”: we rely on this assumption to use a priori a clustering of the vertices as a preliminary step for simplifying the representation of the graphs - as a whole. The clustering phase consists in optimizing a quality measure specifically suitable for the research of dense groups in graphs. This quality measure is the modularity and expresses the “distance” to a null model in which the graph edges do not depend on the clustering. The modularity has shown its relevance in solving the problem of uncovering dense groups in a graph. Optimization of the modularity is done through a stochastic simulated annealing algorithm. The visualization/representation phase, as such, is based on a force-directed algorithm described in Truong et al. (2007). After giving a short introduction to the problem and detailing the vertices clustering and representation algorithms, the paper will introduce and discuss two applications from the social network field

    ModĂšle de langue visuel pour la reconnaissance de scĂšnes

    No full text
    National audienceWe describe here a method to use a graph language modeling approach for imageretrieval and image categorization. Since photographic images are 2D data, we first use im- age regions (mapped to automatically induced concepts) and then spatial relationships between these regions to build a complete image graph representation. Our method deals with different scenarios, where isolated images or groups of images are used for training or testing. The results obtained on an image categorization problem show (a) that the procedure to automatically induce concepts from an image is effective, and (b) that the use of spatial relationships, in addition to concepts, for representing an image content helps improve the classifier accuracy. This approach extends the language modeling approach to information retrieval to the problem of graph-based image retrieval and categorization, without considering image annotations.Dans cet article, nous décrivons une méthode pour utiliser un modÚle de langue sur des graphes pour la recherche et la catégorisation d'images. Nous utilisons des régions d'images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gÚre différents scénarios, selon que des images isolées ou groupées soient utilisés comme base d'apprentissage ou de tests. Les résultats obtenus sur un problÚme de catégorisation d'images montre (a) que la procédure automatique qui associe les concepts à une image est efficace, et (b) que l'utilisation des relations spatiales, en plus des concepts, permet d'améliorer la qualité de la classification. Cette approche présente donc une extension du modÚle de langue classique en recherche d'information pour traiter le problÚme de recherche et de catégorisation d'images représentées par des graphes sans se préoccuper des annotations d'images

    Lignes du temps connectĂ©es pour l’analyse visuelle d’adaptations et de relations entre artistes

    Get PDF
    Le rĂ©cent essor des donnĂ©es liĂ©es ouvertes dĂ©mocratise l’accĂšs Ă  des jeux de donnĂ©es qui prennent souvent la forme de graphes, complexes Ă  comprendre sans support visuel adaptĂ©. La visualisation de graphes est un sujet de recherche encore trĂšs actif. Bien qu’il existe aujourd’hui de nombreuses techniques de visualisation, dĂšs qu’un graphe atteint une certaine grandeur (problĂšme d’échelle) et une certaine quantitĂ© d’attributs (problĂšme de densitĂ© d’informations) les techniques existantes perdent en efficacitĂ©. Lors d’un rĂ©cent projet d’innovation en valorisation des donnĂ©es avec BAnQ, nous avons travaillĂ© avec un vaste jeu de donnĂ©es sur les adaptations musicales. L’objectif Ă©tait d’arriver Ă  reprĂ©senter les relations de collaboration et d’influence entre les artistes tout en restant lisible. Les techniques de visualisation de graphes existantes ne permettaient pas de rĂ©aliser ces tĂąches avec suffisamment de clartĂ©, ce qui nous a amenĂ© Ă  proposer une nouvelle mĂ©thode de visualisation nommĂ©e MuzLink. L’objectif de ce travail de recherche est la conception, le dĂ©veloppement et l’évaluation d’une nouvelle mĂ©thode de visualisation de graphes bipartis multivariĂ©s. La nouvelle mĂ©thode de visualisation a d’abord nĂ©cessitĂ© la crĂ©ation d’un nouveau glossaire musical pour communiquer sans ambiguĂŻtĂ© les diffĂ©rents rĂŽles et relations qui existent entre artistes et chansons. La mĂ©thode de visualisation proposĂ©e est centrĂ©e sur un seul artiste. Elle s’inspire de plusieurs techniques existantes (node-link, lignes du temps et beeswarm) et les combine afin de reprĂ©senter de façon explicite l’évolution des relations de collaboration et d’influence dans le temps. Cette mĂ©thode est divisĂ©e en trois lignes du temps : la premiĂšre contient les chansons produites par l’artiste, la deuxiĂšme contient les chansons qui ont inspirĂ© l’artiste et la troisiĂšme les chansons qui s’inspirent de productions de l’artiste. Chaque relation d’influence entre chansons est reprĂ©sentĂ©e par un lien, crĂ©ant du mĂȘme coup des lignes du temps connectĂ©es. Cette visualisation principale est juxtaposĂ©e Ă  trois autres outils complĂ©mentaires qui permettent de rĂ©pondre Ă  des tĂąches spĂ©cifiques (listes d’artistes, notice de chanson et rĂ©sumĂ© de l’artiste). Les listes d’artistes Ă©numĂšrent les artistes qui ont inspirĂ©, collaborĂ© ou se sont inspirĂ©s de l’artiste. La notice de chanson affiche des informations supplĂ©mentaires sur une chanson sĂ©lectionnĂ©e. Le rĂ©sumĂ© de l’artiste donne une vue globale sur les rĂŽles occupĂ©s et les types de productions de l’artiste.----------ABSTRACT: The rise of Linked Open Data in the recent years is emocratizing access to complex data structures, usually taking the form of very large multivariate graphs. These are typically hard to understand for humans and require the use of visualization tools. While this data structure is a very well-researched topic in data visualization, large and complex graphs — with several heterogeneous node and link attributes — are hard to visualize with existing techniques. During a project in collaboration with the national library and archives agency of the Quebec government, we have been mandated to visualize a complex dataset of relationships between artists. Eleven key exploratory tasks were selected during the initial design process. Standard graph visualization techniques weren’t suited to answers those specific tasks. Furthermore, since the dataset’s structure is an unusual combination of a bipartite graph and trees, a thorough literature review found very few related or similar work. This research proposes a novel visualization method called MuzLink to efficiently explore and discover relationships between artists. The objective is to evaluate the effectiveness of this method for the selected task with a formal user study. Based on all eleven selected tasks, a fully functional prototype was developed. The proposed solution is a multi-facet visualization tool centered around a specific artist. The first view contains 3 connected timelines: (1) the inspirations, (2) the productions, and (3) the influences. Beeswarms of songs are positioned on the timelines according to their relationship with the artist. Songs on the middle timeline are the artist’s production. Songs that inspired the artist are on the top timeline. Songs inspired by the artist are on the bottom timeline. Links are drawn between songs having an influence relationships. This connected timeline allows a topological exploration of inspiration relationships around an artist’s musical production. The second view shows inspired, collaborators, and influenced artists ordered by their number of implications with the current artist. Interactions between the two complementary views allow answering a larger range of tasks. The user can easily navigate between artists with a search bar and by clicking on related artists. Clicking on a song reveals more details regarding the relationships among other songs

    Visualisation de données relationnelles

    Get PDF
    International audienceThis article presents the implementation of a QGis plugin for the visualization and the interactive construction of spacial graphs. Spatial graphs are accurate representations of spatial information through spatial objects linked by relationships (spatial or not). This representation is suited to the modeling and analysis of spatial information by computer processing (data mining, search for shortest paths, etc.). The use of spatial graph suffers from the lack of tools to facilitate the construction and integrated visualization. In this paper, we present a QGis plugin introducing a new type of layer: GraphLayer. These new layers can be integrated into any GIS projects. They offer rich functionality for visualization and interactive editing.Cet article prĂ©sente l'implĂ©mentation d'une extension QGis pour la visualisation et la construction interactive de graphes spatiaux. Les graphes spatiaux sont des reprĂ©sentations de l'information spatiale sous la forme d'objets spatiaux reliĂ©s entre eux par des relations (spatiales ou non). Cette reprĂ©sentation est adaptĂ©e Ă  la modĂ©lisation et Ă  l'analyse d'information spatiale par des traitements informatiques (fouille de donnĂ©es, recherche de plus court chemins, etc). L'utilisation des graphes spatiaux pĂątit de l'absence d'outils facilitant la construction et la visualisation intĂ©grĂ©e. Dans cet article, on prĂ©sente un extension QGis introduisant un nouveau type de couche, les GraphLayer. Ces nouvelles couches peuvent ĂȘtre intĂ©grĂ©es dans les projets SIG. Elles offrent des fonctionnalitĂ©s riches de visualisation et d'Ă©dition interactive

    Relations explicites entre différentes représentations d'image dans un modÚle de graphe visuel

    Get PDF
    National audienceThis paper presents a novel approach, the first to our knowledge, that exploits a complete extension of the language modeling approach from information retrieva l to the problem of graph-based image retrieval and categorization. Since photographic images are 2D data, we first use image regions and local interest points (mapped to automatically induced concepts) and then relationships between these regions to build a complete graph representation of images. The results obtained on categorizing of RobotVision collection from Im ageCLEF 2009 (containing of 5 rooms in an indoor environment) show that (a) the procedure to automatically induce concepts from an image is effective, and (b) the use of spatial relationships, in addition to concepts, for representing an image content helps improve the classifier accuracy.Nous prĂ©sentons dans ce papier une nouvelle mĂ©thode pour exploiter la relation entre diffĂ©rents niveaux de reprĂ©sentation d'image afin de complĂ©ter le modĂšle de graphe visuel. Le modĂšle de graphe visuel est une extension du modĂšle de langue classique en recherche d'information. Nous utilisons des rĂ©gions d'images et des points d'intĂ©rĂȘts (associĂ©es automatiquement Ă  des concepts visuels), ainsi que des relations entre ces concepts, lors de la construction de la reprĂ©sentation sous forme de graphe. Les rĂ©sultats obtenus sur catĂ©gorisation de la collection RobotVision de la compĂ©tition d'ImageCLEF 2009 (contenant 5 piĂšces dans un environnement Ă  l'intĂ©rieur du bĂątiment) montrent que (a) la procĂ©dure de l'induction automatique des concepts d'une image est efficace, et (b) l'utilisation des inter-relations entre 2 niveaux de reprĂ©sentation, en plus de concepts, permet d'amĂ©liorer le taux de reconnaissance

    Représentation d'un grand réseau à partir d'une classification hiérarchique de ses sommets

    Get PDF
    International audienceGraph visualization is an important tool to understand the main features of a network but, when the number of nodes in the graph exceeds few hundreds, standard visualization methods are computationally expensive. Moreover, force directed algorithms do not help the understanding of the community structure of the newtork, if is exists. In this paper, a new visualization method based on a hierarchical clustering of the nodes of the graph is proposed. It can handle graphs having several thousands nodes in a few seconds. Several simplified representations of the graph are accessible, giving the user the opportunity to understand the macroscopic organization of the network and then, to focus on some particular parts of the graph. This refining process is controlled as follows. Partitions under consideration are evaluated via the classical modularity quality measure. A distribution of the quality measure in the case of graphs without structure is obtained by applying the proposed method to random graphs with the same degree distribution as the graph under study. Then only significant partitions are shown during the refining process. This approach is illustrated on several public datasets and compared with other visualization methods meant to emphasize the graph communities. It is also tested on a large network built from a corpus of medieval land charters

    Représentation coinductive des graphes

    Get PDF
    Nous nous intĂ©ressons Ă  la reprĂ©sentation de graphes dans le prouveur Coq. Nous avons choisi de les reprĂ©senter par des types coinductifs dont nous voulions explorer l'utilisation. Ceux-ci permettent de rendre succincte et Ă©lĂ©gante la reprĂ©sentation et d'obtenir la navigabilitĂ© par construction. Nous avons dĂ» contourner la condition de garde dont le but est d'assurer la validitĂ© des opĂ©rations effectuĂ©es sur les objets coinductifs. Son implantation dans Coq est restrictive et interdit parfois des dĂ©finitions sĂ©mantiquement correctes. Une formalisation canonique des graphes dĂ©passe ainsi l'expressivitĂ© directe de Coq. Nous avons donc proposĂ© une solution respectant ces limitations, puis nous avons dĂ©fini une relation sur les graphes nous permettant d'obtenir la mĂȘme notion d'Ă©quivalence qu'avec une reprĂ©sentation classique tout en gardant les avantages de la coinduction. Nous montrons qu'elle est Ă©quivalente Ă  une relation basĂ©e sur des observations finies.We are interested in graph representation in the theorem prover Coq. We have chosen to represent graphs using coinductive types. We wanted to explore their use in Coq. Indeed, they make the graph representation succinct and elegant. Moreover, navigability is ensured by construction. We had to overcome the guardedness condition whose objective is to ensure validity of all operations made on coinductive objects. Its implementation in Coq is restrictive and sometimes forbids definitions, even semantically correct ones. A canonical formalization of graphs thus surmounts Coq's direct expressivity. We have designed a solution respecting these limitations. Then, we have defined a relation on graphs close to the notion of equivalence obtained on a classical representation, keeping however the advantages offered by coinduction. We show that this relation is equivalent to another one based on finite observations of the graphs

    Balades aléatoires dans les Petits Mondes Lexicaux

    Get PDF
    International audienceCet article prĂ©sente une mĂ©thode stochastique pour l'Ă©tude de la structure des grands graphes de terrain de type petits mondes hiĂ©rarchiques. Cette mĂ©thode consiste Ă  transformer un graphe en une chaĂźne de Markov dont les Ă©tats sont les sommets du graphe en question. Des particules se baladent alĂ©atoirement de sommets en sommets dans le graphe en empruntant les arcs du graphe. Ce sont les dynamiques des trajectoires des particules qui nous donnent les propriĂ©tĂ©s structurelles des graphes Ă©tudiĂ©s. Nous verrons que cette approche, qui est une forme de « connexionnisme structurel », permet de proposer en perspective une modĂ©lisation gĂ©omĂ©trique du sens oĂč les petits mondes hiĂ©rarchiques sont non seulement une excellente compression de la forme du sens, mais de plus permettent une navigation et un accĂšs trĂšs efficace Ă  l'information, avec une dynamique d'acquisition du gĂ©nĂ©ral vers le particulier par raffinement (enfant en cours d'acquisition de sa langue maternelle), ainsi qu'une excellente robustesse en cas de dĂ©ficit (aphasie, apprenant), et un raisonnement Ă  granularitĂ© variable ce qui permet de faire chuter la complexitĂ©. Pour illustrer cette approche, des exemples et rĂ©sultats concrets sont prĂ©sentĂ©s sur des graphes d'origine linguistique, ce qui permet d'envisager un outil de navigation pour le web, dont l'ergonomie cognitive d'accĂšs Ă  l'information est une mĂ©taphore de l'acquisition du langage par les jeunes enfants

    Apprentissage de modÚles causaux par réseaux de neurones artificiels

    Full text link
    Dans ce mĂ©moire par articles, nous nous intĂ©ressons Ă  l’apprentissage de modĂšles causaux Ă  partir de donnĂ©es. L’intĂ©rĂȘt de cette entreprise est d’obtenir une meilleure comprĂ©hension des donnĂ©es et de pouvoir prĂ©dire l’effet qu’aura un changement sur certaines variables d’un systĂšme Ă©tudiĂ©. Comme la dĂ©couverte de liens causaux est fondamentale en sciences, les mĂ©thodes permettant l’apprentissage de modĂšles causaux peuvent avoir des applications dans une plĂ©thore de domaines scientifiques, dont la gĂ©nomique, la biologie et l’économie. Nous prĂ©sentons deux nouvelles mĂ©thodes qui ont la particularitĂ© d’ĂȘtre des mĂ©thodes non-linĂ©aires d’apprentissage de modĂšles causaux qui sont posĂ©es sous forme d’un problĂšme d’optimisation continue sous contrainte. Auparavant, les mĂ©thodes d’apprentissage de mo- dĂšles causaux abordaient le problĂšme de recherche de graphes en utilisant des stratĂ©gies de recherche voraces. RĂ©cemment, l’introduction d’une contrainte d’acyclicitĂ© a permis d’abor- der le problĂšme diffĂ©remment. Dans un premier article, nous prĂ©sentons une de ces mĂ©thodes: GraN-DAG. Sous cer- taines hypothĂšses, GraN-DAG permet d’apprendre des graphes causaux Ă  partir de donnĂ©es observationnelles. Depuis la publication du premier article, plusieurs mĂ©thodes alternatives ont Ă©tĂ© proposĂ©es par la communautĂ© pour apprendre des graphes causaux en posant aussi le problĂšme sous forme d’optimisation continue avec contrainte. Cependant, aucune de ces mĂ©thodes ne supportent les donnĂ©es interventionnelles. Pourtant, les interventions rĂ©duisent le problĂšme d’identifiabilitĂ© et permettent donc l’utilisation d’architectures neuronales plus expressives. Dans le second article, nous prĂ©sentons une autre mĂ©thode, DCDI, qui a la particularitĂ© de pouvoir utiliser des donnĂ©es avec diffĂ©rents types d’interventions. Comme le problĂšme d’identifiabilitĂ© est moins important, une des deux instanciations de DCDI est un approximateur de densitĂ© universel. Pour les deux mĂ©thodes proposĂ©es, nous montrons que ces mĂ©thodes ont de trĂšs bonnes performances sur des donnĂ©es synthĂ©tiques et rĂ©elles comparativement aux mĂ©thodes traditionelles.In this thesis by articles, we study the learning of causal models from data. The goal of this entreprise is to gain a better understanding of data and to be able to predict the effect of a change on some variables of a given system. Since discovering causal relationships is fundamental in science, causal structure learning methods have applications in many fields that range from genomics, biology, and economy. We present two new methods that have the particularity of being non-linear methods learning causal models casted as a continuous optimization problem subject to a constraint. Previously, causal strutural methods addressed this search problem by using greedy search heuristics. Recently, a new continuous acyclity constraint has allowed to address the problem differently. In the first article, we present one of these non-linear method: GraN-DAG. Under some assumptions, GraN-DAG can learn a causal graph from observational data. Since the publi- cation of this first article, several alternatives methods have been proposed by the community by using the same continuous-constrained optimization formulation. However, none of these methods support interventional data. Nevertheless, interventions reduce the identifiability problem and allow the use of more expressive neural architectures. In the second article, we present another method, DCDI, that has the particularity to leverage data with several kinds of interventions. Since the identifiabiliy issue is less severe, one of the two instantia- tions of DCDI is a universal density approximator. For both methods, we show that these methods have really good performances on synthetic and real-world tasks comparatively to other classical methods

    Réalisation d'un outil de simulation de réseaux sociaux multiplexes

    Get PDF
    Nous prĂ©sentons dans ce document notre projet de recherche dans le cadre de la maitrise en informatique de l'universitĂ© du QuĂ©bec Ă  MontrĂ©al. Dans le cadre de cette maĂźtrise nous avons conçu un langage de modĂ©lisation de rĂ©seaux sociaux permettant de modĂ©liser plusieurs rĂ©seaux sociaux simultanĂ©ment. Nous voulions que ce langage soit proche du langage naturel afin d'ĂȘtre accessible aux nĂ©ophytes en informatique. Nous avons Ă©galement rĂ©alisĂ© une plate-forme permettant l'exĂ©cution de ce langage. La conception de ce langage est motivĂ©e par le fait que gĂ©nĂ©ralement au sein d'un ensemble social donnĂ© il existe plusieurs types d'interactions sociales simultanĂ©ment. Par exemple si nous considĂ©rons le groupe social constituĂ© par l'ensemble des employĂ©s d'une entreprise, il existe souvent des relations de collaboration mais Ă©galement des relations d'amitiĂ© et/ou des relations de conseil entre les employĂ©s de l'entreprise. L'Ă©tude des rĂ©seaux sociaux doit souvent prendre en compte tous les types de relations prĂ©sentes dans un ensemble social afin de bien comprendre l'Ă©volution de cet ensemble social. Dans le but de mettre en pratique le langage que nous avons conçu nous avons Ă©tudiĂ© la corrĂ©lation entre plusieurs rĂ©seaux sociaux. Nous avons Ă©galement comparĂ© notre plate-forme avec les outils d'analyse et de simulation de rĂ©seaux disponibles sur le marchĂ© actuellement. \ud ______________________________________________________________________________ \ud MOTS-CLÉS DE L’AUTEUR : rĂ©seaux sociaux, analyse de rĂ©seaux, simulation, rĂ©seaux multiplexe
    corecore