20 research outputs found

    Accounting for the Role of Long Walks on Networks via a New Matrix Function

    Get PDF
    We introduce a new matrix function for studying graphs and real-world networks based on a double-factorial penalization of walks between nodes in a graph. This new matrix function is based on the matrix error function. We find a very good approximation of this function using a matrix hyperbolic tangent function. We derive a communicability function, a subgraph centrality and a double-factorial Estrada index based on this new matrix function. We obtain upper and lower bounds for the double-factorial Estrada index of graphs, showing that they are similar to those of the single-factorial Estrada index. We then compare these indices with the single-factorial one for simple graphs and real-world networks. We conclude that for networks containing chordless cycles---holes---the two penalization schemes produce significantly different results. In particular, we study two series of real-world networks representing urban street networks, and protein residue networks. We observe that the subgraph centrality based on both indices produce significantly different ranking of the nodes. The use of the double factorial penalization of walks opens new possibilities for studying important structural properties of real-world networks where long-walks play a fundamental role, such as the cases of networks containing chordless cycles

    Universality in protein residue networks

    Get PDF
    Residue networks representing 595 nonhomologous proteins are studied. These networks exhibit universal topological characteristics as they belong to the topological class of modular networks formed by several highly interconnected clusters separated by topological cavities. There are some networks which tend to deviate from this universality. These networks represent small-size proteins having less than 200 residues. We explain such differences in terms of the domain structure of these proteins. On the other hand, we find that the topological cavities characterizing proteins residue networks match very well with protein binding sites. We then investigate the effect of the cutoff value used in building the residue network. For small cutoff values, less than 5Å, the cavities found are very large corresponding almost to the whole protein surface. On the contrary, for large cutoff value, more than 10.0 Å, only very large cavities are detected and the networks look very homogeneous. These findings are useful for practical purposes as well as for identifying "protein-like" complex networks. Finally, we show that the main topological class of residue networks is not reproduced by random networks growing according to Erdös-Rényi model or the preferential attachment method of Barabási-Albert. However, the Watts-Strogatz (WS) model reproduces very well the topological class as well as other topological properties of residue network. We propose here a more biologically appealing modification of the WS model to describe residue networks

    Valid path-based graph vertex numbering

    Full text link
    A labelling of a graph is an assignment of labels to its vertex or edge sets (or both), subject to certain conditions, a well established concept. A labelling of a graph G of order n is termed a numbering when the set of integers {1,...,n} is used to label the vertices of G distinctly. A 2-path (a path with three vertices) in a vertex-numbered graph is said to be valid if the number of its middle vertex is smaller than the numbers of its endpoints. The problem of finding a vertex numbering of a given graph that optimises the number of induced valid 2-paths is studied, which is conjectured to be in the NP-hard class. The reported results for several graph classes show that apparently there are not one or more numbering patterns applicable to different classes of graphs, which requires the development of a specific numbering for each graph class under study

    Algorithmen fĂĽr Topologiebewusstsein in Sensornetzen

    Get PDF
    This work deals with algorithmic and geometric challenges in wireless sensor networks (WSNs). Classical algorithm theory, with a single processor executing one sequential program while having access to the complete data of the problem at hand, does not suit the needs of WSNs. Instead, we need distributed protocols where nodes collaboratively solve problems that are too complex for a single node. First we analyze a location problem, where the nodes obtain a sense of the network topology and their position in it. Computing coordinates in a global coordinate system is NP-hard in almost all relevant variants. So we present a completely new approach instead. The network builds clusters and constructs an abstract graph that closely reflects the topology of the network region. The resulting topology awareness suits the needs of some applications much better than the coordinate-based approach. In the second part, we present a novel flow problem, which adds battery constraints to dynamic network flows. Given a time horizon, we seek a flow from source to sink that maximizes the total amount of delivered data. As there is no prior work on this problem, we also analyze it in a centralized setting. We prove complexity results for several variants and present approximation schemes. The third part introduces the WSN simulator Shawn. By letting the user choose among different geometric communication models and data structures for the resulting graph, Shawn can adapt to many different setups, including mobile ones. Due to its design, Shawn is much faster than comparable simulation environments.Die vorliegende Arbeit beschäftigt sich mit algorithmischen und geometrischen Fragestellungen in Sensornetzwerken. Im Gegensatz zur klassischen Algorithmik, bei der ein einzelner Prozessor sequenziell Anweisungen abarbeitet und vollen Zugriff auf die Probleminstanz hat, werden hier verteilte Protokolle benötigt, bei denen die Knoten gemeinsam eine Aufgabe bewältigen, zu der sie allein nicht in der Lage wären. Zuerst untersuchen wir das grundlegende Problem, wie Sensorknoten ein Bewusstsein für ihre Position erlangen können. Motiviert daraus, dass das Problem, Koordinaten für ein globales Koordinatensystem zu bestimmen, in fast allen Varianten NP-schwer ist, wird ein vollkommen neuer Ansatz skizziert, bei dem das Netzwerk selbständig geometrische Cluster bildet und einen abstrakten Graphen konstruiert, der die Topologie des zugrunde liegenden Gebiets sehr genau widerspiegelt. Das sich daraus ergebende Positionsbewusstsein ist für einige Anwendungen dem klassischen euklidischen Ansatz deutlich überlegen. Der zweite Teil widmet sich einem Flussproblems für Sensornetzwerke, dass klassische dynamische Flüsse um Batteriebeschränkungen erweitert. Gesucht ist ein Fluss, der für gegebenen Zeithorizont die Datenmenge maximiert, die von einer Quelle zur Senke geschickt werden kann. Dieses Problem wird auch im zentralisierten Modell untersucht, da keine Vorarbeiten existieren. Wir beweisen Komplexitäten von Problemvarianten und entwickeln Approximationsschemata. Der dritte Teil stellt den Netzwerksimulator Shawn vor. Da der Benutzer zwischen verschiedenen geometrischen Kommunikationsmodellen wählen kann und das Speichermodell für den daraus resultierenden Graphen an den verfügbaren Speicher sowie an Simulationsparameter wie eventuell mögliche Mobilität der Knoten anpassen kann, ist Shawn hochflexibel und gleichzeitig deutlich schneller als vergleichbare Simulationsumgebungen

    Generalizations of the Multicut Problem for Computer Vision

    Get PDF
    Graph decomposition has always been a very important concept in machine learning and computer vision. Many tasks like image and mesh segmentation, community detection in social networks, as well as object tracking and human pose estimation can be formulated as a graph decomposition problem. The multicut problem in particular is a popular model to optimize for a decomposition of a given graph. Its main advantage is that no prior knowledge about the number of components or their sizes is required. However, it has several limitations, which we address in this thesis: Firstly, the multicut problem allows to specify only cost or reward for putting two direct neighbours into distinct components. This limits the expressibility of the cost function. We introduce special edges into the graph that allow to define cost or reward for putting any two vertices into distinct components, while preserving the original set of feasible solutions. We show that this considerably improves the quality of image and mesh segmentations. Second, multicut is notorious to be NP-hard for general graphs, that limits its applications to small super-pixel graphs. We define and implement two primal feasible heuristics to solve the problem. They do not provide any guarantees on the runtime or quality of solutions, but in practice show good convergence behaviour. We perform an extensive comparison on multiple graphs of different sizes and properties. Third, we extend the multicut framework by introducing node labels, so that we can jointly optimize for graph decomposition and nodes classification by means of exactly the same optimization algorithm, thus eliminating the need to hand-tune optimizers for a particular task. To prove its universality we applied it to diverse computer vision tasks, including human pose estimation, multiple object tracking, and instance-aware semantic segmentation. We show that we can improve the results over the prior art using exactly the same data as in the original works. Finally, we use employ multicuts in two applications: 1) a client-server tool for interactive video segmentation: After the pre-processing of the video a user draws strokes on several frames and a time-coherent segmentation of the entire video is performed on-the-fly. 2) we formulate a method for simultaneous segmentation and tracking of living cells in microscopy data. This task is challenging as cells split and our algorithm accounts for this, creating parental hierarchies. We also present results on multiple model fitting. We find models in data heavily corrupted by noise by finding components defining these models using higher order multicuts. We introduce an interesting extension that allows our optimization to pick better hyperparameters for each discovered model. In summary, this thesis extends the multicut problem in different directions, proposes algorithms for optimization, and applies it to novel data and settings.Die Zerlegung von Graphen ist ein sehr wichtiges Konzept im maschinellen Lernen und maschinellen Sehen. Viele Aufgaben wie Bild- und Gittersegmentierung, Kommunitätserkennung in sozialen Netzwerken, sowie Objektverfolgung und Schätzung von menschlichen Posen können als Graphzerlegungsproblem formuliert werden. Der Mehrfachschnitt-Ansatz ist ein populäres Mittel um über die Zerlegungen eines gegebenen Graphen zu optimieren. Sein größter Vorteil ist, dass kein Vorwissen über die Anzahl an Komponenten und deren Größen benötigt wird. Dennoch hat er mehrere ernsthafte Limitierungen, welche wir in dieser Arbeit behandeln: Erstens erlaubt der klassische Mehrfachschnitt nur die Spezifikation von Kosten oder Belohnungen für die Trennung von zwei Nachbarn in verschiedene Komponenten. Dies schränkt die Ausdrucksfähigkeit der Kostenfunktion ein und führt zu suboptimalen Ergebnissen. Wir fügen dem Graphen spezielle Kanten hinzu, welche es erlauben, Kosten oder Belohnungen für die Trennung von beliebigen Paaren von Knoten in verschiedene Komponenten zu definieren, ohne die Menge an zulässigen Lösungen zu verändern. Wir zeigen, dass dies die Qualität von Bild- und Gittersegmentierungen deutlich verbessert. Zweitens ist das Mehrfachschnittproblem berüchtigt dafür NP-schwer für allgemeine Graphen zu sein, was die Anwendungen auf kleine superpixel-basierte Graphen einschränkt. Wir definieren und implementieren zwei primal-zulässige Heuristiken um das Problem zu lösen. Diese geben keine Garantien bezüglich der Laufzeit oder der Qualität der Lösungen, zeigen in der Praxis jedoch gutes Konvergenzverhalten. Wir führen einen ausführlichen Vergleich auf vielen Graphen verschiedener Größen und Eigenschaften durch. Drittens erweitern wir den Mehrfachschnitt-Ansatz um Knoten-Kennzeichnungen, sodass wir gemeinsam über Zerlegungen und Knoten-Klassifikationen mit dem gleichen Optimierungs-Algorithmus optimieren können. Dadurch wird der Bedarf der Feinabstimmung einzelner aufgabenspezifischer Löser aus dem Weg geräumt. Um die Allgemeingültigkeit dieses Ansatzes zu überprüfen, haben wir ihn auf verschiedenen Aufgaben des maschinellen Sehens, einschließlich menschliche Posenschätzung, Mehrobjektverfolgung und instanz-bewusste semantische Segmentierung, angewandt. Wir zeigen, dass wir Resultate von vorherigen Arbeiten mit exakt den gleichen Daten verbessern können. Abschließend benutzen wir Mehrfachschnitte in zwei Anwendungen: 1) Ein Nutzer-Server-Werkzeug für interaktive Video Segmentierung: Nach der Vorbearbeitung eines Videos zeichnet der Nutzer Striche auf mehrere Einzelbilder und eine zeit-kohärente Segmentierung des gesamten Videos wird in Echtzeit berechnet. 2) Wir formulieren eine Methode für simultane Segmentierung und Verfolgung von lebenden Zellen in Mikroskopie-Aufnahmen. Diese Aufgabe ist anspruchsvoll, da Zellen sich aufteilen und unser Algorithmus dies in der Erstellung von Eltern-Hierarchien mitberücksichtigen muss. Wir präsentieren außerdem Resultate zur Mehrmodellanpassung. Wir berechnen Modelle in stark verrauschten Daten indem wir mithilfe von Mehrfachschnitten höherer Ordnung Komponenten finden, die diesen Modellen entsprechen. Wir führen eine interessante Erweiterung ein, die es unserer Optimierung erlaubt, bessere Hyperparameter für jedes entdeckte Modell auszuwählen. Zusammenfassend erweitert diese Arbeit den Mehrfachschnitt-Ansatz in unterschiedlichen Richtungen, schlägt Algorithmen zur Inferenz in den resultierenden Modellen vor und wendet ihn auf neuartigen Daten und Umgebungen an

    What does a bioenergetic network approach tell us about the functioning of ecological communities?

    Full text link
    Les perturbations auxquelles font face les communautés écologiques, du fait des activités humaines, sont à l'origine de changements profonds dans ces communautés. Nombreuses caractéristiques des espèces sont altérées, de leur physiologie à leur occurrence même. Ces changements se répercutent sur la composition, la diversité et la structure des communautés, puisque les espèces n'interagissent pas tout le temps de la même manière en fonction des conditions. Prévoir le devenir de ces communautés émergentes, et des fonctions qu'elles soutiennent est un défi central de l'écologie et de nos sociétés. Différents cadres conceptuels ont été utilisés pour relever ce défi, basés sur différents mécanismes écologiques, et ont divergé en plusieurs domaines. D'un côté, l'analyse des chaînes trophiques utilise la consommation pour expliquer les effets de la diversité verticale (le nombre de niveaux trophiques) sur le fonctionnement, et de l'autre côté, les analyses biodiversité-fonctionnement lient compétition et effets de la diversité horizontale (la diversité au sein des niveaux trophiques isolés). Chacun de ces domaines a produit des résultats clés pour comprendre les conséquences fonctionnelles des changements de composition et diversité des communautés écologiques. Cependant, ils sont chacun basés sur différentes simplifications fortes des communautés. L'hypothèse qui sous-tend cette thèse est que la réconciliation en un même cadre de travail des résultats fondamentaux de ces champs conceptuels divergents, ainsi que des effets des changements de structure de la biodiversité, est une étape clé pour pouvoir améliorer notre compréhension du fonctionnement de communautés écologiques en changement. L'essor récent des méthodes d'analyse des réseaux trophiques, et des modèles permettant de simuler le fonctionnement de ces réseaux trophiques offre un cadre idéal pour cette réconciliation. En effet, les réseaux trophiques cartographient les échanges de matière entre toutes les espèces d'une communauté, permettant la mise en place d'interactions variées. Ils reflètent mieux la réalité complexe des communautés que les chaînes trophiques ou leurs niveaux trophiques isolés en intégrant notamment compétition et consommation. Un modèle ressource-consommateur bioénergétique classique, développé par Yodzis et Innes (1992), permet d'en simuler le fonctionnement, en intégrant des mécanismes et taux testés empiriquement. Au-delà d'utiliser ces outils, cette thèse se concentre aussi sur leur évaluation. Après un premier chapitre d'introduction, le second chapitre propose une plateforme ouverte, commune, solidement testée et efficace pour l'utilisation du modèle bioénergétique, permettant ainsi une synthèse plus rapide et aisée des résultats. Le troisième chapitre est une revue du corpus méthodologique d'analyse des réseaux trophiques, proposant une gamme de méthodes robustes et informatives, et soulignant leur domaine d'application et leurs limites. Enfin le quatrième chapitre met ce cadre méthodologique à l'épreuve. Dans ce chapitre, nous montrons l'existence d'une relation entre la complexité de la structure du réseau trophique des communautés et leur régime de fonctionnement, se traduisant par la réalisation de différentes prédictions issues de l'analyse des chaînes trophiques ou des analyses diversité-fonctionnement. Cette mise en évidence des conditions structurelles pour la réalisation de différentes prédictions nous permet de mieux comprendre quels mécanismes écologiques prédominent selon différentes conditions, dirigeant l'effet de la diversité sur le fonctionnement.Human-driven disturbances are causing profound changes in ecological communities, as many characteristics of species are altered, from their physiology to their very occurrence. These changes affect the composition, diversity and structure of communities, since species do not always interact in the same way under different conditions. Predicting the fate of these emerging communities, and the functions they support, is a central challenge for ecology and our societies. Diverging conceptual frameworks have been used to address this challenge, based on different ecological mechanisms. On the one hand, food chain analysis uses consumption to explain the effects of vertical diversity (the number of trophic levels) on functioning, and on the other hand, biodiversity-functioning analyses link competition and the effects of horizontal diversity (diversity within isolated trophic levels). Each of these domains has produced key results for understanding the functional consequences of changes in the composition and diversity of ecological communities. However, they are each based on different strong simplifications of communities. The hypothesis underlying this thesis is that reconciling the fundamental results of these divergent conceptual fields, as well as the effects of changes in the structure of biodiversity, into a single framework is a key step towards improving our understanding of the functioning of changing ecological communities. The recent development of food web analysis and of models to simulate food webs functioning provides an ideal framework for this reconciliation. Food webs map the exchange of matter between all species in a community, allowing for a variety of interactions to take place. They better reflect the complex reality of communities than food chains or their isolated trophic levels, notably by integrating competition and consumption. A classical consumer-resource bioenergetic model developed by Yodzis and Innes (1992) specifically makes it possible to realistically simulate their functioning, using empirically tested mechanisms and rates. Beyond using these tools, this thesis focuses on their evaluation and implementation. After a first, introductory chapter, the second chapter proposes an open, common, well-tested and efficient platform for the use of the bioenergetic model, allowing a faster and easier synthesis of the results. The third chapter is a review of the methodological corpus for ecological networks analysis, outlining a range of robust and informative methods, and highlighting their scope and limitations. Finally, the fourth chapter puts this methodological framework to the test. In this chapter, we show the existence of a relationship between the complexity of communities' food-web structure and functioning regime, resulting in the realization of different predictions from food chain analysis or diversity-functioning analyses. This demonstration of the structural conditions for the realization of different predictions allows us to better understand which ecological mechanisms predominate under different conditions, directing the effect of diversity on functioning
    corecore