Update schemes and other extensions to support logical modelling of multicellular systems

Abstract

Tese de Mestrado, Bioinformática e Biologia Computacional, 2021, Universidade de Lisboa, Faculdade de CiênciasO estado de uma célula é controlado por vários componentes biológicos, como genes, proteínas, metabólitos, que interagem entre si, criando grandes redes regulatórias. Os componentes dessas redes não só regulam os outros componentes, como também a si próprios, fazendo-o através de fatores de transcrição, fosforilação, entre outros. Vários formalismos foram usados para modelar este tipo de redes, entre eles está o formalismo lógico, que representa uma rede regulatória como um grafo, onde os vértices correspondem a componentes biológicos e as arestas às interações entre estes. Este formalismo é especialmente bem sucedido no estudo deste tipo de redes devido à abstração do componente num vértice que permite que este represente qualquer tipo de componente biológico, refletindo assim a complexidade biológica inerente a estas redes. Também o tipo de interação é abstraído, considerando apenas o impacto da interação, se é positiva ou negativa. O modelo lógico é caracterizado por tradicionalmente considerar apenas dois valores para os seus componentes, a sua ausência (0) ou a sua presença (1). O valor de cada componente é regulado por uma função lógica dependente dos componentes que o regulam, esta função lógica representa as interações antagônicas, acumulativas, entre outras, no componente regulado. O estudo dos sistemas biológicos estende-se também à consideração de sistemas multicelulares. A dinâmica destes sistemas leva à formação de padrões devido à interação (sinalização) entre células. Estes padrões resumem-se a organizações espaciais de células que atingem estados estáveis (estados de onde qualquer célula não consegue sair). O EpiLog (Epithelium Logical modelling) é uma ferramenta informática desenvolvida em Java, com interface gráfica, utilizada para estudar a formação de padrões sobre um epitélio. Este epitélio é modelado por um autómato celular, composto por uma matriz de células hexagonais, onde o estado de cada célula é controlado por um modelo lógico. A implementação e simulação dos modelos lógicos é feita pela biblioteca bioLQM, utilizado pelo EpiLog. O autómato celular, framework usada pelo EpiLog, é um formalismo discreto usado para estudar propriedades de auto-organização emergentes das interações entre os autómatos. Consiste numa matriz de autómatos onde o valor zero ou um associado a cada célula (ou autómato) é regulado pelas interações com os seus vizinhos próximos. O EpiLog estende esta definição ao associar modelos lógicos a cada célula, o que permite uma representação mais complexa do estado da célula. Também a definição de vizinhança é alterada para permitir a modelação de sinalização entre células não adjacentes, representando a sinalização parácrina. A dinâmica de um modelo lógico é influenciada pela escolha do esquema de atualização. O esquema de atualização determina a ordem pela qual os valores dos componentes dos modelos são atualizados, isto é, a ordem pela qual a função de regulação é aplicada. O EpiLog faz a atualização das suas células do epitélio considerando “classes de prioridade”. Este esquema define que os componentes dos modelos se dividam em classes com ranks associados, de tal modo que os componentes pertencentes a classes com ranks mais baixos não são atualizados enquanto existirem componentes de classes com ranks mais elevados que sejam atualizáveis. As classes em si são atualizadas de forma síncrona, isto é, os componentes pertencentes à mesma classe são atualizados simultaneamente, gerando um único sucessor. Do ponto de vista biolófico, o esquema de atualização síncrono não faz sentido, visto implicar que todos os vários processos biológicos aconteçam com a mesma taxa de velocidade. Este pressuposto leva a artefatos de modelação que não correspondem ao observado in vivo. Por oposição ao esquema de atualização síncrono, o assíncrono atualiza cada componente individualmente, criando tantos sucessores quanto o número de componentes que possam ser atualizados. O foco principal desta tese é a implementação de novos esquemas de atualização que introduzem alguma assincronicidade dentro das classes de prioridades, com o objetivo de mitigar e explorar as fragilidades do esquema de atualização síncrona. A implementação é feita no bioLQM, onde as classes são compostas por grupos, sendo que estes têm um esquema de atualização associado, os sucessores da classe são a união dos sucessores dos grupos da classe. O EpiLog limita uma classe a apenas um grupo, tornando os dois essencialmente sinónimos. Os novos esquemas de atualização dividem-se em sucessores múltiplos e sucessores únicos, EpiLog usa apenas os segundos, sendo estes o uniformemente aleatório e não uniformemente aleatório. O esquema uniforme aleatório corresponde à escolha aleatória de um sucessor entre os sucessores resultantes de um esquema assíncrono, enquanto o esquema não uniforme aleatório implica que seja atribuído a cada componente uma probabilidade de ser atualizado, e o sucessor final é escolhido dos sucessores assíncronos com base nessa probabilidade. Ambos os esquemas permitem que um maior número de trajetórias seja explorado, as resultantes do esquema assíncrono, o esquema de atualização não uniforme aleatório permite também integrar conhecimento cinético sobre as interações do sistema, levando à exploração de trajetórias em teoria com maior significado biológico. A utilidade dos novos esquemas foi testada através de um caso de estudo, um modelo lógico já publicado do módulo de genes segment polarity, que consolida os segmentos do embrião da Drosophila. É mostrado que os novos esquemas de atualização permitem obter a maioria dos padrões estáveis obtidos na publicação original ao contrário do esquema síncrono inicial. São testadas várias mutações além do caso wild-type, e são considerados dois epitélios: um único segmento de seis células, e um epitélio de 12 por 12 células. O primeiro epitélio corresponde à situação modelada na publicação original, e a replicação dos resultados foi conseguida com ambos os esquemas de atualização “duas classes com uniforme aleatório” e apenas “não uniforme aleatório” (ou seja uma classe). Este resultado demonstra a necessidade da introdução da assincronicidade nos esquemas de atualização. No epitélio de 12 por 12 células devido ao grande número de células (12×12) e consequentemente ao número elevado de estados possíveis, foi necessário definir um esquema de atualização mais restrito, o “duas classes com não uniforme aleatório” para obter os mesmos resultados. Este último resultado mostra a utilidade da combinação dos novos esquemas de atualização com as classes de prioridade, que oferecem ao modelador maior flexibilidade e controlo sobre que trajetórias explorar. Também é mostrado que com a implementação dos novos esquemas, o EpiLog está mais apto para modelar grandes epitélios, sendo assim uma melhor ferramenta no estudo de formação de padrões em sistemas multicelulares. Uma vez que os novos esquemas de atualização foram implementados no bioLQM, favorecem não só o EpiLog, como também todas as ferramentas dependentes do bioLQM. Estas ferramentas ganham agora classes de prioridades que permitem a definição de vários grupos numa classe, e esquemas de atualização de grupos que aceitam esquemas de atualização com sucessores múltiplos além de únicos. Além da implementação dos novos esquemas de atualização, foram adicionadas duas outras funções ao EpiLog, com o objetivo de tornar mais completa e fácil a experiência de modelação do utilizador. A primeira, chamada “phenotype tracking”, foi motivada pela necessidade de uma visão alternativa e complementar ao output do EpiLog, que se foca ao nível do epitélio, dando uma representação gráfica do estado do mesmo (onde o estado das interno células pode ser consultado ao ser clicado). Esta nova ferramenta gera uma série temporal dos estados internos das células ao longo de uma simulação, o que melhora o entendimento do utilizador sobre os resultados de uma simulação. É também possível definir sobre que estados a informação será gerada, isto é, a definição de fenótipos que consistem em conjuntos de estados da célula (do modelo lógico) que caracterizam uma célula. Os fenótipos são definidos pelo utilizador dependente do interesse biológico que lhe atribui. Foi também implementada uma maneira alternativa de editar as definições de um epitélio, que permite ao utilizador fazê-lo de forma textual, evitando o uso da interface gráfica. Esta adição é indicada para utilizadores mais experientes, permitindo assim uma edição mais rápida e eficiente.The state of a cell is controlled by a regulatory network of biological components. The logical formalism is a powerful discrete framework to model these networks, as it abstracts the type of biological components capturing the nature, positive or negative, of their interactions. Cell-cell signalling results in pattern formation through the acquisition of distinct cellular phenotypes. This work focuses on the logical modelling of multi-cellular systems, accounting for cell-cell signalling. EpiLog is a Java tool for studying pattern formation of an epithelium, modelled by a cellular automaton, composed of a two-dimensional grid of hexagonal cells, where logical models govern their internal states. The dynamics of the cellular logical model are simulated by the bioLQM toolkit, used by EpiLog. The model dynamics are influenced by updating schemes, which set the order of the model components updates. EpiLog uses priority synchronous classes, where all the class components are updated simultaneously. Synchronous updating unrealistically assumes that all processes occur at the same time, producing modelling artefacts. This thesis implements new updating schemes to mitigate the drawbacks of the synchronous update, by introducing some asynchronicity. The usefulness of the new updating schemes is confirmed with a case study, a published logical model of the segment polarity module, which consolidates the fly embryo segments. We show that the new updating schemes capture most of the stable patterns obtained in the original publication, and that EpiLog with these new updaters is thus more suitable to study pattern formation in multi-cellular systems. Additionally, two features were implemented. The user can now better assess simulation results thanks to the generation of data concerning the cell states along the simulation. Furthermore, the possibility to edit model definitions rather than doing so through the GUI facilitates the work of the advanced users

    Similar works