109 research outputs found
Computational Analysis of Biological networks
Caratterizzare, descrivere ed estrarre informazioni da un network, \ue8 sicuramente uno dei principali obbiettivi della scienza, dato che lo studio dei network interessa differenti campi della ricerca, come la biologia, l'economia, le scienze sociali, l'informatica e cos\uec via. Ci\uf2 che si vuole \ue8 riuscire ad estrarre le propriet\ue0 fondamentali dei network e comprenderne la funzionalit\ue0. Questa tesi riguarda sia l'analisi topologica che l' analisi dinamica dei network biologici, anche se i risultati possono essere applicati a diversi campi. Per quanto riguarda l'analisi topologica viene utilizzato un approccio orientato ai nodi, utilizzando le centralit\ue0 per individuare i nodi pi\uf9 rilevanti e integrando tali risultati con dati da laboratorio. Viene inoltre descritto CentiScaPe, un software implementato per effettuare tale tipo di analisi. Vengono inoltre introdotti i concetti di "interference" e "robustness" che permettono di comprendere come un network si riarrangia in seguito alla rimozione o all'aggiunta di nodi. Per quanto riguarda l'analisi dinamica, si mostra come l'abstract interpretation pu\uf2 essere utilizzata nella simulazione di pathways per ottenere i risultati di migliaia di simulazioni in breve tempo e come possibile soluzione del problema della stima dei parametri mancanti.This thesis, treating both topological and dynamic points of view,
concerns several aspects of biological networks analysis.
Regarding the topological analysis of biological networks, the main
contribution is the node-oriented point of view of the analysis. It means
that instead of concentrating on global properties of the networks, we
analyze them in order to extract properties of single nodes. An excellent
method to face this problem is to use node centralities. Node centralities
allow to identify nodes in a network having a relevant role in the network
structure. This can not be enough if we are dealing with a biological
network, since the role of a protein depends also on its biological activity
that can be detected with lab experiments.
Our approach is to integrate centralities analysis and data from biological
experiments. A protocol of analysis have been produced, and the CentiScaPe tool for
computing network centralities and integrating topological analysis with
biological data have been designed and implemented. CentiScaPe have been
applied to a human kino-phosphatome network and according to our protocol,
kinases and phosphatases with highest centralities values have been
extracted creating a new subnetwork of most central kinases and
phosphatases. A lab experiment established which of this proteins presented
high activation level and through CentiScaPe the proteins with both high
centrality values and high activation level have been easily identified.
The notion of node centralities interference have also been introduced to deal with central role of nodes in a
biological network. It allow to identify which are the nodes that are more
affected by the remotion of a particular node measuring the variation on
their centralities values when such a node is removed from the
network. The application of node centralities interference to the human
kino-phosphatome revealed that different proteins affect centralities values
of different nodes. Similarly to node centralities
interference, the notion of centrality robustness of a node is introduced.
This notion reveals if the central role of a node depends on other
particular nodes in the network or if the node is ``robust'' in the sense
that even if we remove or add other nodes the central role of the
node remains almost unchanged.
The dynamic aspects of biological networks analysis have been treated from an
abstract interpretation point of view. Abstract interpretation is a powerful
framework for the analysis of software and is excellent in deriving
numerical properties of programs. Dealing with pathways, abstract
interpretation have been adapted to the analysis of pathways simulation.
Intervals domain and constants domain have been succesfully used to
automatically extract information about reactants concentration. The
intervals domain allow to determine the range of concentration of the proteins, and
the constants domain have been used to know if a protein concentration
become constant after a certain time. The other domain of analysis used is
the congruences domain that, if applied to pathways simulation can easily
identify regular oscillating behaviour in reactants concentration.
The use of abstract interpretation allows to execute thousands of simulation
and to completely and automatically characterize the behaviour of the
pathways. In such a way it can be used also to solve the problem of
parameters estimation where missing parameters can be detected with a brute
force algorithm combined with the abstract interpretation analysis.
The abstract interpretation approach have been succesfully applied to the
mitotic oscillator pathway, characterizing the behaviour of the pathway
depending on some reactants.
To help the analysis of relation between reactants in the network,
the notions of variables interference and variables abstract interference
have been introduced and adapted to biological pathways simulation.
They allow to find relations
between properties of different reactants of the pathway. Using the abstract interference
techniques we can say, for instance, which range of concentration of a protein
can induce an oscillating behaviour of the pathway
Structure and topology of transcriptional regulatory networks and their applications in bio-inspired networking
Biological networks carry out vital functions necessary for sustenance despite environmental adversities. Transcriptional Regulatory Network (TRN) is one such biological network that is formed due to the interaction between proteins, called Transcription Factors (TFs), and segments of DNA, called genes. TRNs are known to exhibit functional robustness in the face of perturbation or mutation: a property that is proven to be a result of its underlying network topology. In this thesis, we first propose a three-tier topological characterization of TRN to analyze the interplay between the significant graph-theoretic properties of TRNs such as scale-free out-degree distribution, low graph density, small world property and the abundance of subgraphs called motifs. Specifically, we pinpoint the role of a certain three-node motif, called Feed Forward Loop (FFL) motif in topological robustness as well as information spread in TRNs.
With the understanding of the TRN topology, we explore its potential use in design of fault-tolerant communication topologies. To this end, we first propose an edge rewiring mechanism that remedies the vulnerability of TRNs to the failure of well-connected nodes, called hubs, while preserving its other significant graph-theoretic properties. We apply the rewired TRN topologies in the design of wireless sensor networks that are less vulnerable to targeted node failure. Similarly, we apply the TRN topology to address the issues of robustness and energy-efficiency in the following networking paradigms: robust yet energy-efficient delay tolerant network for post disaster scenarios, energy-efficient data-collection framework for smart city applications and a data transfer framework deployed over a fog computing platform for collaborative sensing --Abstract, page iii
Multiplex urban networks in the Yangtze River Delta : spatial patterns and their explanatory factors
LOGISTICS IN CONTESTED ENVIRONMENTS
This report examines the transport and delivery of logistics in contested environments within the context of great-power competition (GPC). Across the Department of Defense (DOD), it is believed that GPC will strain our current supply lines beyond their capacity to maintain required warfighting capability. Current DOD efforts are underway to determine an appropriate range of platforms, platform quantities, and delivery tactics to meet the projected logistics demand in future conflicts. This report explores the effectiveness of various platforms and delivery methods through analysis in developed survivability, circulation, and network optimization models. Among other factors, platforms are discriminated by their radar cross-section (RCS), noise level, speed, cargo capacity, and self-defense capability. To maximize supply delivered and minimize the cost of losses, the results of this analysis indicate preference for utilization of well-defended convoys on supply routes where bulk supply is appropriate and smaller, and widely dispersed assets on shorter, more contested routes with less demand. Sensitivity analysis on these results indicates system survivability can be improved by applying RCS and noise-reduction measures to logistics assets.Director, Warfare Integration (OPNAV N9I)Major, Israel Defence ForcesCivilian, Singapore Technologies Engineering Ltd, SingaporeCommander, Republic of Singapore NavyCommander, United States NavyCaptain, Singapore ArmyLieutenant, United States NavyLieutenant, United States NavyMajor, Republic of Singapore Air ForceCaptain, United States Marine CorpsLieutenant, United States NavyLieutenant, United States NavyLieutenant, United States NavyLieutenant, United States NavyLieutenant, United States NavyCaptain, Singapore ArmyLieutenant Junior Grade, United States NavyCaptain, Singapore ArmyLieutenant Colonel, Republic of Singapore Air ForceApproved for public release. distribution is unlimite
Discovery of tissue specific network properties associated with cancer driver genes
Tese de Mestrado em Bioquímica, Faculdade de Ciências, Universidade de Lisboa, 2022Using the notion of disease modules, network medicine has effectively identified diseaseassociated genes in recent years. In biological networks, genes linked to a particular illness tend to
interact closely [1]. These networks allow both physical and functional connections between
biomolecules to be identified, resulting in a map of cell components and processes that constitute
biological systems [2]. Not all disease-associated genes, however, have a major impact on disease
phenotype.
The discovery of important genes able to produce or change disease phenotype paves the path
to new therapies and a personalized medicine strategy. Recent research has found that biological
network topological features per se may accurately predict perturbation effects in a dynamical model of
the system with a 65-80% accuracy [3, 4].
Biological networks differ depending on whatever tissue or cell type is being studied. As a
result, each gene's topological features and ability to impact the system may alter [5].
The main goal of this thesis is to discover network topological parameters associated with
influential cancer driver genes using context specific networks. In order to achieve this, we evaluated
local network features around each driver gene across multiple tissue specific networks, including
tissues that are affected in the disease and others where the gene perturbation has no significant effect.
We aimed to identify topological parameters and its characteristics contributing to the cancer driver
gene’s influential role.
The results of this dissertation point out that several topological parameters can be used to
determine cancer “driver” genes. We found that these genes have higher values of topological
parameters, such as Degree or Closeness, in tissues where they tend to cause cancer. We also found that
this difference is present in oncogenes and tumor suppressor genes. Another factor that we found to
influence the value of topological parameters is the number of tissues in which these genes cause the
disease. There is an increasing trend of topological parameter values with the increase of the number of
tissues in which they cause cancer. Together, these results support the significant association of
topological parameters like the Degree with the influential role of a driver gene in cancer.Usando a noção de módulos de doença, a medicina de redes identificou eficazmente nos últimos
anos genes associados a doenças. Nas redes biológicas, os genes ligados a uma determinada doença
tendem a interagir proximamente [1] . Essas redes permitem que conexões físicas e funcionais entre
biomoléculas sejam identificadas, resultando num mapa de componentes celulares e processos que
constituem sistemas biológicos [2]. Nem todos os genes associados à doença, no entanto, têm um grande
impacto no fenótipo da doença.
A descoberta de genes importantes capazes de produzir ou alterar o fenótipo da doença abre
caminho para novas terapias e uma estratégia de medicina personalizada. Pesquisas recentes
descobriram que as características topológicas da rede biológica podem prever com precisão os efeitos
de perturbação num modelo dinâmico do sistema com uma precisão de 65-80% [3, 4].
As redes biológicas diferem dependendo do tipo de tecido ou célula estudado. Como resultado,
as características topológicas de cada gene e a capacidade de impactar o sistema podem ser alteradas
[5].
O principal objetivo desta dissertação é descobrir parâmetros topológicos de rede associados a
genes promotores de cancro usando redes específicas de tecido. Para conseguir isso, avaliamos as
características da rede local em torno de cada gene promotor em várias redes específicas de tecidos,
incluindo tecidos afetados pela doença e outros onde a perturbação do gene não tem efeito significativo.
Deste modo, podemos identificar parâmetros topológicos e as características que contribuem para o
papel influente dos genes promotores do cancro.
Para atingir os nossos objetivos, começámos por construir e otimizar as nossas redes específicas
de tecidos. Cada rede específica de tecido foi construída usando quatro bases de dados diferentes de
interações proteína-proteína, vias de sinalização e fatores de transcrição. Tentámos quatro métodos
diferentes de construir as redes, incluindo o uso do filtro de níveis de expressão génica acima de 0,1 e 5
transcritos por milhão em cada tecido. Construímos também uma matriz associando os genes promotores
de cancro (retirados de uma base de dados online de genes promotores de cancro) aos tecidos onde
provocam a doença. Cada gene promotor foi inserido em seis categorias diferentes de acordo com o
número de tecidos onde provocam cancro, sendo a categoria seis aquela que inclui os genes que
provocam a doença em seis ou mais tecidos. Começámos por comparar os valores dos parâmetros
topológicos dos genes em tecidos onde estes provocam a doença versus os seus valores em tecidos onde
não a provocam. Esses valores também foram comparados com uma lista de genes associados ao cancro
(retirados de uma base de dados online de genes associados a doenças), mas não promotores de cancro,
e uma lista de genes não associados a nenhuma doença. Este estudo foi feito sobre os quatro diferentes
métodos de construção de rede. Continuámos o estudo observando como os parâmetros topológicos mostraram diferenças ao nível do tecido. Analisámos em cada tecido os valores dos parâmetros
topológicos dos genes promotores que causam a doença num determinado tecido versus os valores dos
genes que não causam doença naquele tecido. Depois de comparar os valores dos parâmetros
topológicos usando todos os genes promotores juntos num grupo global, queríamos verificar se a
diferença entre os valores destes nos tecidos onde causam cancro versus os valores nos tecidos onde não
provocam a doença, também estava presente dentro das categorias do número de tecidos onde os genes
promotores causam cancro e como esses valores aumentam ou diminuem ao longo dessas categorias.
Avaliamos em seguida o impacto combinado dos valores dos parâmetros topológicos (selecionando o
parâmetro topológico “Degree”) de genes promotores de cancro em tecidos onde causam doença versus
onde não causam e também a diferença entre estes ao longo das seis diferentes categorias de número de
tecidos onde provocam cancro, usando um Modelo Linear Generalizado (GLM) para avaliar a interação
desses fatores.
Da base de dados de onde retiramos a lista de genes promotores de cancro, também retiramos
uma lista de oncogenes e genes supressores de tumor que usámos para avaliar também as diferenças dos
valores dos seus parâmetros topológicos nos tecidos onde causam cancro versus os tecidos onde não
causam. A fim de avaliar outras variáveis que possam ter impacto para além dos parâmetros topológicos
e que possam também diferir dependendo do número de tecidos onde os genes “drivers” causam a
doença, usamos os dados da base de dados de onde retiramos os genes promotores que incluíam
informações sobre o número de interações que cada gene promotor estabelece com diferentes miRNA e
sobre o número de complexos proteicos que estes genes integram. Também avaliamos o impacto da
expressão génica nas diferentes categorias de número de tecidos. Por fim, enriquecemos funcionalmente
os genes promotores de cancro, usando dois métodos diferentes. No primeiro método usamos os genes
que tinham uma diferença topológica maior (para este estudo usamos apenas o parâmetro topológico
“Degree”) entre os tecidos onde causam ou não cancro. Classificamos cada gene como positivo,
negativo e não significativo com base na diferença entre o valor médio do “Degree” nos tecidos onde
causam cancro versus o valor nos tecidos onde não causam. O segundo método foi o enriquecimento
dos diferentes genes promotores de cancro de acordo com o número de tecidos que causam cancro.
Fizemos esse estudo usando as diferentes categorias de número de tecidos.
Globalmente, os nossos resultados sugerem que os valores dos parâmetros topológicos (por
exemplo, “Degree“ e “Closeness”) tendem a ser maiores nos tecidos em que os genes promoteres de
cancro provocam a doença ( “Tissue Drivers”), seguidos pelos valores dos genes de cancro que são não
promotores de cancro mas estão associados ao desenvolvimento da doença (“Disease Genes”), os
valores dos genes promotores de cancro nos tecidos onde não causam cancro (“NonTissueDrivers”) e
por último, com os menores valores de parâmetros topológicos, os genes que não estão associados a
qualquer doença. A diferença entre os valores dos parâmetros topológicos nos “TissueDrivers” versus
“NonTissueDrivers” é estatisticamente significativa na maioria dos parâmetros topológicos testados e
nos diferentes métodos de rede utilizados, exceto no método “JustHuRiTPM5Zminmax” (usando apenas a base de dados Huri). Quando analisámos em cada tecido os valores dos parâmetros topológicos,
pudemos ver que os valores de “Degree” tendem a ser maiores nos genes promotores de cancro que
causam cancro naquele tecido em comparação com os genes promotores que não provocam cancro nesse
tecido. Essa diferença é estatisticamente significativa em muitos dos tecidos analisados.
Em relação a como os valores dos parâmetros topológicos se comportam ao longo das diferentes
categorias associadas ao número de tecidos em que os genes promotores causam cancro, descobrimos
que nos genes promotores de cancro que causam doença em apenas em um e dois tecidos, o valor do
“Degree” nos tecidos onde causam cancro é menor que o valor apresentado nos tecidos onde não causam
cancro. Observamos a tendência inversa nos genes promotores que causam cancro em seis ou mais
tecidos (o valor do “Degree” é maior nos tecidos onde causam cancro). Observamos também que o valor
do “Degree” aumenta gradativamente ao longo do número da categoria de tecidos, atingindo o valor
mais alto na categoria seis (constituída por genes promotores que provocam cancro em seis ou mais
tecidos).
No modelo linear generalizado (GLM), pudemos ver o efeito combinado da variável tipo de
tecido (onde o gene promotor provoca ou não cancro, mostrando uma diferença estatisticamente
significativa entre estas duas situações) e da variável número de tecidos onde os genes promotores
provocam cancro (mostrando também uma valor estatisticamente significativo entre as diferentes
categorias). A interação entre esses dois fatores também foi estatisticamente significativa.
Também pudemos observar valores de “Degree” estatisticamente diferentes entre os genes
promotores supressores de tumor nos tecidos que causam cancro (com valores mais altos) e os valores
nos tecidos onde não causam. Vimos também a mesma diferença nos Oncogenes, mas com menor
significância. Os valores do “Degree” nos genes Supressores de Tumores foram inferiores aos valores
do “Degree” apresentados pelos Oncogenes.
Pudemos igualmente ver uma clara tendência de correlação entre o aumento do número de
tecidos com o aumento do número de complexos que os genes promotores de cancro integram. O mesmo
comportamento foi observado em relação ao número de miRNAs com os quais os genes promotores
interagem.
Em relação à expressão do mRNA ao longo das categorias de número de tecidos, pudemos ver
uma diferença estatisticamente significativa nas categorias dois e três entre os valores dos genes
promotores(em relação ao parâmetro topológico “Degree”) nos tecidos onde causam cancro versus onde
não causam.
Finalmente, no estudo de enriquecimento de funções pudemos ver que os processos biológicos,
funções moleculares e componentes celulares que obtivemos enriquecidos usando o método das
diferentes categorias de número de tecidos estão muito mais relacionados com os processos de cancro
baseados na literatura (“hallmarks of cancer”). Não conseguimos encontrar uma divisão muito clara
entre funções biológicas enriquecidas que tiveram uma diferença de z-score do “Degree” acima de 1 e aqueles com diferença abaixo de -1. Não encontramos nenhum processo de enriquecimento funcional
relevante em nenhum desses dois grupos de genes e que de alguma forma os pudesse distinguir entre si.
Os resultados desta dissertação apontam para que vários parâmetros topológicos possam estar
associados a genes promotores de cancro. Verificámos que estes genes têm valores de parâmetros
topológicos, como o Degree ou Closeness, mais elevados nos tecidos onde tendencionalmente provocam
cancro. Verificámos também que esta diferença está presente nos oncogenes e nos genes supressores de
tumor. Outro fator que verificamos influenciar o valor dos parâmetros topológicos, é o número de
tecidos em que estes genes provocam a doença. Há uma tendência crescente do valor topológico com
um número de tecidos em que provocam cancro
- …