14 research outputs found
Computational prediction of the human-microbial oral interactome
Background: The oral cavity is a complex ecosystem where human chemical compounds coexist with a particular microbiota. However, shifts in the normal composition of this microbiota may result in the onset of oral ailments, such as periodontitis and dental caries. In addition, it is known that the microbial colonization of the oral cavity is mediated by protein-protein interactions (PPIs) between the host and microorganisms. Nevertheless, this kind of PPIs is still largely undisclosed. To elucidate these interactions, we have created a computational prediction method that allows us to obtain a first model of the Human-Microbial oral interactome.Results: We collected high-quality experimental PPIs from five major human databases. The obtained PPIs were used to create our positive dataset and, indirectly, our negative dataset. The positive and negative datasets were merged and used for training and validation of a naïve Bayes classifier. For the final prediction model, we used an ensemble methodology combining five distinct PPI prediction techniques, namely: literature mining, primary protein sequences, orthologous profiles, biological process similarity, and domain interactions. Performance evaluation of our method revealed an area under the ROC-curve (AUC) value greater than 0.926, supporting our primary hypothesis, as no single set of features reached an AUC greater than 0.877. After subjecting our dataset to the prediction model, the classified result was filtered for very high confidence PPIs (probability ≥ 1-10-7), leading to a set of 46,579 PPIs to be further explored.Conclusions: We believe this dataset holds not only important pathways involved in the onset of infectious oral diseases, but also potential drug-targets and biomarkers. The dataset used for training and validation, the predictions obtained and the network final network are available at http://bioinformatics.ua.pt/software/oralint.info:eu-repo/semantics/publishedVersio
Previsão computacional de interacções proteína-proteína entre diferentes espécies
Doutoramento em Ciências da ComputaçãoO estudo em larga escala de proteínas e das suas eventuais interações tem sido alvo de bastante atenção pela comunidade científica. Os métodos de análise experimentais têm produzido uma quantidade imensa de dados, que têm sido armazenados em diferentes repositórios. A disponibilidade destes dados, muitos deles curados por especialistas, abre um leque de oportunidades de investigação. Dado que as técnicas experimentais de identificação de interações proteína-
proteína (PPIs) são dispendiosas, demoradas e requerem análise de um perito, os métodos computacionais têm vindo a dar um contributo valioso neste domínio. Embora já existam alguns métodos computacionais para prever PPIs, estes apenas se focam na previsão
de PPIs dentro da mesma espécie. Deste modo, estes métodos não podem ser aplicados diretamente na previsão de PPIs entre diferentes espécies. Estas interações estão na origem das doenças infecciosas, sendo essencial a sua identificação para prevenir e travar estados de doença. Esta tese apresenta novos modelos computacionais para prever PPIs entre diferentes espécies, para estimar o impacto destas interações no hospedeiro, e para prever interações entre medicamentos e os seus alvos proteicos. A inovação desta proposta advém do uso de técnicas de aprendizagem automática em combinação com análise de redes biológicas. Os resultados obtidos irão ser úteis para compreender as associações entre mecanismos biológicos e estados de doença, e para o desenvolvimento de técnicas de diagnóstico e terapia.Proteomics and the study of protein-protein interactions (PPIs) have become a trending research topic in the past decade. Thanks to the high-throughput experimental methodologies, the amount of data generated and uploaded to heterogeneous data repositories is increasing exponentially, presenting several research opportunities. Since experimental protein interaction identification techniques are expensive, time consuming, and require expert analysis, computational methods will prove crucial to tackle this issue. Several efforts have already been made regarding this problem, resulting in models for predicting intra-species interactions. Nevertheless, these models cannot be directly applied to inter-species PPI prediction. Inter-species PPIs are responsible or the basis of colonization and infection by bacterial pathogens and thus, their identification is crucial to prevent and treat disease states. This thesis proposes new computational models to predict inter-species PPIs, the impact of such associations to the human host, and associations between drugs and bacterial targets. The innovation of this proposal comes from the use of machine learning techniques tuned to biological problems, combined with complex biological network analysis. The obtained results will offer the means to better understand the associations between biological mechanisms and disease states, and aid the development of new diagnostic and therapeutic tools
Interatómica da cavidade oral : Oralint v2.0
Introdução: As proteínas são moléculas essenciais ao funcionamento do organismo,
apresentam inúmeras funções e estão envolvidas na regulação da maioria dos processos
celulares. A interação proteína-proteína é um dos mecanismos utilizado na cavidade oral
para a relação microrganismo-hospedeiro. Apesar da reconhecida importância dos
microrganismos, o conhecimento específico das interações estabelecidas entre estes e o
Homem é atualmente um tópico relevante de investigação, que visa compreender do
ponto de vista molecular a colonização do corpo humano pelos microrganismos. Muitos
resultados da proteómica têm sido publicados sobre proteínas microbianas e proteínas
do hospedeiro, hoje é preciso pensar em formas de analisar e interligar os
conhecimentos produzidos pelo trabalho laboratorial de forma rápida e eficaz. Com este
propósito surgiram métodos computacionais para a previsão da interação proteínaproteína.
A análise e interpretação crítica dos dados gerados pelas ciências Ómicas para
novas propostas de interação com significado biológico só é possível com os métodos
computacionais através de ferramentas bioinformáticas.
Objetivos: Analisar e discutir os resultados obtidos pelo OralInt v2.0 à luz dos
conhecimentos biológicos. Gerar informação que possibilite melhorar o desempenho do
OralInt v2.0.
Materiais e métodos: Dos resultados obtidos do OralInt v2.0 foram selecionadas as
200000 interações com maior nível de confiança, que foram analisadas através de
diversas ferramentas informáticas.
Resultados e Discussão: O OralInt v2.0 analisou 21086 proteínas das quais obteve um
elevado número de previsão de interações. Com as 200000 interações apresentando um
score entre 1 e 0,925 foi construído o interactoma da cavidade oral, em que constam
apenas 10768 proteínas. No entanto 47% das interações são estabelecidas entre
proteínas do hospedeiro e proteínas microbianas. Este resultado melhora o desempenho
do OralInt v2.0 do que o registado na versão anterior (12%). A análise topológica da
rede do interactoma da cavidade oral apresenta uma distribuição de interações
compatíveis com outras redes de PPIs estudadas, em que a maioria das proteínas (74%)
apresentam um número de previsão de interação baixo ([1-25]). O OralInt v2.0 prevê algumas interações interessantes para Porphyromonas gingivalis e para Streptococcus
mutans dois microrganismos importantes na cavidade oral.
Conclusão: Este trabalho mostra que a atual versão do OralInt v2.0 já consegue uma
previsão próxima do que se pensa ser o ambiente oral (há mais interações
microbioma/hospedeiro previstas). No entanto são, necessários ajustes adicionais ao
mesmo para que possam figurar interações entre proteínas já descritas na literatura. É
ainda necessário olhar para os parâmetros analisados pelo OralInt v2.0 para que os
parâmetros biológicos das proteínas tenham um maior peso nas previsões obtidas.Introduction: Proteins are essential to the organism, and many are involved in the
regulation of relevant cellular processes. Protein-protein interaction is one of the
mechanisms used in the oral cavity for the establishment of microorganism-host
interaction. Despite the recognized importance of microorganisms, the specific
knowledge of the interactions established between them and the Human is currently an
important topic of research that aims to understand, from the molecular point of view,
the colonization of the human body by microorganisms. Many proteomics results have
been published on microbial and host proteins, now we must think of ways to analyze
and interlink the knowledge produced by laboratory work. For this purpose several
computational methods emerged for predicting protein-protein interactions. The
analysis and critical interpretation of data generated by the Omics sciences for new
proposals of interactions with biological significance is only possible with
computational methods using bioinformatics tools.
Objectives: To analyze and discuss the results obtained by OralInt v2.0 in the light of
biological knowledge. To generate information that will allow the improvement of the
performance of OralInt v2.0.
Methods: From the results of OralInt v2.0, 200,000 interactions were selected with the
highest confidence level and analyzed with various software tools.
Results and Discussion: The OralInt v2.0 analyzed 21086 proteins, and produced a
large number of predicted interactions. Only the interactions with a significance level
between 1 and 0,925 were analyzed. The interactome of the oral cavity, was constructed
with 10,768 proteins. However, 47% of the interactions are established between the host
and microbial proteins. The topological analysis of the interactome of the oral cavity
presents a distribution network compatible with interactions of other PPIs networks
studied, in which most proteins (74%) have a low number of prediction interaction ([1-
25]). New interactions not previously described are proposed for Porphyromonas
gingivalis and Streptococcus mutans.
Conclusion: Although the current version of OralInt v2.0 can make a close prediction
of what is thought to be the oral environment (there are more microbiome interactions /
host predicted), further adjustments are required to include interactions between proteins described in the literature. Furthermore, it is necessary to look at the parameters
analyzed by OralInt v2.0 to ensure that biological parameters of proteins are given more
weight in the obtained prediction
Interatómica da cavidade oral
A cavidade oral humana é um ecossistema complexo onde fatores do hospedeiro, microbianos e ambientais interagem num equilíbrio dinâmico. A compreensão da biologia da cavidade oral e dos distúrbios que a afetam depende de ferramentas bioinformáticas que permitam a compilação, integração e aplicação da informação gerada por técnicas de alto rendimento, como as técnicas de proteómica, que se dedica à identificação de todas as proteínas expressas.
A compreensão dos mecanismos moleculares que se desenrolam na cavidade oral assenta na interação entre as moléculas presentes. O conhecimento destes mecanismos tem aplicações na fisiologia e fisiopatologia do sistema cavidade oral.
No sentido de responder à necessidade de estudar os genes e proteínas de forma integrada, dando realce às interações estabelecidas, começaram a ser desenvolvidas bases de dados de interatómica que incluem interações conhecidas e previstas através de algoritmos, associando-lhe um índice de confiança. O nosso trabalho contribuiu para o aperfeiçoamento de um algoritmo que permite a determinação de interações proteína-proteína. É utilizada a informação estrutural e de interações anteriormente determinadas entre os vários domínios das proteínas.
Este estudo tem como objetivo analisar, interpretar e explorar os resultados da aplicação do algoritmo OralInt ao conjunto de proteínas identificado por técnicas de proteómica como presentes na cavidade oral utilizando a base de dados OralOme, assim como verificar se algumas das interações descritas na bibliografia e determinadas experimentalmente na cavidade oral, se encontram presentes nas previsões e validar os resultados através de uma análise da literatura.
O desenvolvimento de ferramentas bioinformáticas que permitam a proposta de interações proteína-proteína, na cavidade oral, pode fornecer uma enorme quantidade de informação que vai assumir implicações na compreensão dos mecanismos moleculares dos processos que ocorrem na cavidade oral em situações fisiológicas e patológicas.
Só com o conhecimento dos microrganismos que habitam a cavidade oral, das moléculas por eles produzidas e das interações destas com as do hospedeiro, podemos chegar ao entendimento molecular total.The human oral cavity is a complex ecosystem where host, microbial and environmental factors interact in a dynamic equilibrium. Understanding the biology of oral cavity and disorders affecting it depends on bioinformatics tools to compile, integrate and apply the information generated by high-throughput techniques such as proteomics, which is dedicated to the identification of all the expressed proteins.
The understanding of the molecular mechanisms that take place in the oral cavity is based on the interaction between molecules present. The knowledge of these mechanisms has applications in physiology and pathophysiology of oral cavity system.
In order to address the need for studying genes and proteins in an integrated way, by emphasizing the interactions established, inteatomic databases that include known and algorithmically predicted interactions, associated to a confidence index, began to be developed. This work contributes to the improvement of an algorithm allowing the determination of protein-protein interactions based on the structural information and interactions previously described between the various domains of the proteins (OralInt).
This study aims to describe the results of applying the algorithm OralInt to the set of proteins identified by proteomics techniques as in the oral cavity using the OralOme database and to check if some of the interactions described in the literature and determined experimentally in the oral cavity, are present in the predictions.
The development of bioinformatics tools that allow the proposal of protein-protein interactions in the oral cavity may provide enormous information that will have implications on the understanding of the molecular mechanisms occurring in the oral cavity in physiological and pathological situations.
Only with the knowledge of the microorganisms that inhabit the oral cavity, the molecules produced by them and the interactions with the host, can we reach the molecular understanding of the oral cavity
Glico-OralOma na perimplantite
Apesar da ênfase da medicina dentária preventiva nos últimos anos, continua a ser
elevado o número de indivíduos parcial ou totalmente desdentados, necessitando de
tratamentos que devolvam a funcionalidade. Nesse sentido, a implantologia tem-se tornado a
área de eleição para que esses problemas sejam minimizados, proporcionando uma melhor
qualidade de vida. A periimplantite, uma falha tardia dos implantes dentários, é definida como
um processo inflamatório que afeta os tecidos circundantes de um implante osteointegrado em
função, resultando na perda de osso de suporte. Esta patologia tem consequências tanto a
nível económico como na saúde oral dos pacientes. Assim, urge identificar os mecanismos
moleculares que estão envolvidos nesta patologia.
O objetivo deste trabalho consiste e identificar as proteínas alteradas e as
glicoproteínas cuja atividade possa ser modificada, de modo a identificar não só os processos
moleculares que se encontram comprometidos na periimplantite, mas também esclarecer o
contributo da flora que está presente de forma diferenciada nesta patologia.
Recorrendo à biomedicina computacional, foi possível tratar dados no sentido de
equacionar razões moleculares subjacentes à periimplantite.
O estabelecimento do proteoma da periimplantite possibilitou adicionar 39 proteínas à
base de dados OralCard, permitindo pela primeira vez compilar informação relativamente à
periimplantite nesta base de dados. A caracterização funcional do OralOma da periimplantite
permitiu identificar alterações em determinadas funções moleculares, processos biológicos e
vias de sinalização. Não foi possível determinar o GlicOralOma devido à escassez de
informações. Relativamente ao microbioma da periimplantite verificou-se existir escassez de
estudos nesta área, sendo apenas identificados 5 géneros como aumentados na periimplantite.
De igual forma, verificou-se uma escassez de dados que permitissem estabelecer relações com
a periimplantite aquando da análise de interactómica.
Este trabalho permitiu elucidar mecanismos moleculares que levam à perda óssea em
redor do implante, o que poderá permitir o estabelecimento de alvos para futuros estudos
experimentais e de novas abordagens na intervenção clínica na periimplantite.Despite the increased emphasis on preventive dentistry in recent years, remains high
the number of partial or total edentulous people, requiring treatments that restore
functionality. Therefore, implantology has become the main area of specialisation for these
problems to be minimized, recovering quality of life. Peri-implantitis, the late failure of the
dental implant, is an inflammatory process affecting the tissues surrounding an
osseointegrated implant in function, resulting in the loss of supporting bone. This pathology
has consequences both economically and in the oral health of patients. Thus, it is urgent to
identify the molecular mechanisms that are involved on it.
The aim of this work is to identify altered proteins and glycoproteins whose activity
can be modified, in order to identify not only the molecular processes that are engaged in
peri-implantitis, but also to clarify the contribution of flora that is present in different ways in
this pathology.
Using the computational biomedicine, it was possible to process data in order to
equate molecular reasons underlying peri-implantitis.
Establishing periimplantitis proteome allowed to add 39 proteins to OralCard
database, making possible for the first time to compile periimplantitis information in this
database. Functional characterization of the peri-implantitis OralOma led to identify changes
in certain molecular functions, biological processes and signaling pathways. It was not
possible to determine the Glyco-OralOme due to lack of information. Regarding the periimplantitis
microbiome it was noted the lack of studies in this area, being only identified five
genders as increased in peri-implantitis. Similarly, there was a paucity of data that would
allow establishing relationships with peri-implantitis when of the interactomics examination.
This work helped to clarify the molecular mechanisms that lead to bone loss around
the implant, which may allow the establishment of targets for further experimental studies and
new approaches in clinical intervention in peri-implantiti
Interactoma da cavidade oral em cancro oral
Introdução: a cavidade oral é um ecossistema complexo com um papel crucial em processos biológicos como a fala, respiração e digestão, e é influenciada por fatores físicos, químicos, nutricionais e ambientais, refletindo as interações moleculares estabelecidas entre proteínas do hospedeiro e proteínas produzidas pelo microbiota que o coloniza.
O cancro da cavidade oral é dos mais prevalentes em todo o mundo e, por este mesmo motivo, a investigação científica tende a desenvolver novas técnicas no sentido de clarificar a fisiopatologia e descobrir novos métodos de diagnóstico, tratamento e prevenção.
As ferramentas bioinformáticas desempenham um papel importante nesta tarefa, fornecendo os meios que permitem estabelecer os pares de proteínas interatuantes, ou seja, o interactoma hospedeiro-microbiota em cancro oral.
Objetivos: determinar e interpretar, do ponto de vista fisiopatológico, o conjunto de interações entre as proteínas microbianas e do hospedeiro na cavidade oral, no contexto do cancro oral, isto é, identificar as moléculas envolvidas, mas também os mecanismos moleculares em que elas participam.
Material e métodos: as proteínas humanas do cancro oral foram submetidas ao OralInt – ferramenta informática que identifica interações moleculares interorganismo na cavidade oral – de modo a estabelecer o interactoma hospedeiro-microbiota. As proteínas com interação foram submetidas ao AgBase com o intuito de verificar os processos biológicos em que participam.
Resultados e Conclusão: o conhecimento do Interactoma do cancro oral permitiu verificar quais os eventos biológicos com maior relevância em cancro oral, que poderão estar sob influência do microbiota oral. Algumas das proteínas poderão ser utilizadas para o diagnóstico precoce constituindo um painel de biomarcadores e no tratamento mais direcionado e menos invasivo, formando potenciais alvos terapêuticos.Introduction: the oral cavity is a complex ecosystem with a crucial role in biological processes such as speech, breathing and digestion, and is influenced by physical, chemical, nutritional and environmental factors, reflecting the molecular interactions established between host proteins and proteins produced by the colonizing microbiota.
Oral cavity cancer is one of the most prevalent worldwide and, on that basis, scientific research is needed to develop new techniques to clarify the pathophysiology and discover new methods of diagnosis, treatment and prevention.
Bioinformatics tools play an important role in this task by providing the means for establishing the pairs of interacting proteins, which is in this work we considered the host-microbial interactome in oral cancer.
Objectives: to determine and interpret, from a pathophysiological point of view, the set of interactions between the host and microbial proteins in the oral cavity, in the oral cancer context that’s, the identification of the molecules involved and the molecular mechanisms in which they participate.
Methods: human proteins of oral cancer were submitted to Oralint – software tool that identifies interorganism molecular interactions in the oral cavity- to establish the microbial–host interactome. The proteins with interaction were submitted to AgBase in order to verify the biological processes in which they participate.
Results and Conclusion: the knowledge of the Interactome of oral cancer has shown the biological processes with higher relevance in oral cancer, which may be under the influence of the oral microbiota. Some of the proteins may be used for early diagnosis in a panel of biomarkers and more targeted and less invasive treatments, becoming potential therapeutic target
Saliva as a non-invasive diagnostic tool: COVID-19 and T2DM as case-study
Saliva has nowadays a vast research background of how it can mirror the body's health status. Specific salivary biomarkers have been already suggested for multiple diseases and is particularly useful for detecting infectious diseases. We focused on the importance of having a non-invasive, painless and self-collected fluid to study different aspects of two known pandemic diseases: COVID-19 and Type 2 Diabetes Mellitus.
COVID-19 is the most impacting global pandemic of all time requiring frequent testing of populations. The necessity to identify cost-effective strategies for the detection of SARS-CoV-2 outbreak became a priority. Nasopharyngeal samples were considered the sampling golden standard but require a healthcare professional to collect the sample causing discomfort and pain to the patient. As saliva has proved successful in SARS-CoV-2 detection, a pooling strategy could be a good approach to decrease the number of individual tests and hazardous material waste which is also beneficial for the environment. We have tested this strategy on two hundred and seventy-nine saliva samples with pools of 10 and 20 randomized samples through RT-PCR. Cycle Threshold of the genes detected was 29.7. Consecutive reactions analysis of positive samples showed an equivalent cycle threshold average (p 0.05). We concluded that saliva-pool samples allowed effective SARS-CoV-2 screening on 10-sample and 20-sample pools. Our strategy was successfully applied in population-wide testing of more than 2000 individuals, showing that it is possible to use pooled saliva as diagnostic fluid for SARS-CoV-2 infection.
The SARS-CoV-2 detection is well established with reliable methodologies including saliva as a detection fluid. In the opposite direction are the molecular alterations induced by this infectious virus which remain elusive. We developed a hybrid proteomics and in silico interactomics strategy to establish a COVID-19 salivary protein profile. The most distinctive proteins between healthy and COVID-19 samples were defined with the Partial Least-Squares Discriminant Analysis and the enrichment analysis was performed with FunRich software. In parallel, Protein-Protein virus-host interactome was identified with OralInt algorithm. Five dysregulated biological processes were identified in the COVID-19 proteome profile: Apoptosis, Energy Pathways, Immune Response, Protein Metabolism, and Transport. We identified 10 proteins (KLK 11, IMPA2, ANXA7, PLP2, IGLV2-11, IGHV3-43D, IGKV2-24, TMEM165, VSIG10, and PHB2) that had never been associated with SARS-CoV-2 infection, representing new evidence for the molecular profile behind COVID-19. Interactomics analysis showed viral influence on the host immune response, mainly through interaction with the degranulation of neutrophils. From our results, we can conclude that the virus also alters the host’s energy metabolism and interferes with apoptosis mechanisms.
Type 2 Diabetes Mellitus is a chronic metabolic disease and is a major health risk due to its characteristic long-term complications. It is estimated that about 537 million people live with diabetes worldwide and will continue to increase. Diagnosis and glucose monitoring in diabetes are well established. However, monitoring the many of diabetes complications remains a challenge, compromising patients' prognosis and quality of life. We established a hybrid strategy that identified salivary markers of T2DM and its complications. From the functional analysis we highlight metabolic processes, response to stimulus, immune system processes and signalling as disrupted biological processes by the known relation with T2DM. The enrichment analysis identified 11 deregulated biological processes emphasizing 20 proteins directly related to complications in diabetes. Diabetic retinopathy, metabolic syndrome, insulin resistance, molecular impact of glucose and insulin homeostasis dysregulation, atherosclerosis, diabetic foot ulcer, protein catabolism and salivary gland function are diabetic complication capable of being monitored using saliva. We conclude that saliva has the potential to identify several molecules altered in diabetic patients compared to non-diabetic patients and that may be biomarkers not only of diabetes but also of the different complications of this disease.
In conclusion, with this research we have confirmed the potential of saliva as a fluid of interest in both diagnosing and discovering new insights into diseases. Saliva was crucial in demonstrating the flexibility and capacity of its use demonstrated by the development of a reliable detection of SARS-CoV-2, the identification and discussion of molecular aspects of viral infection in and with the host, and the discovery of new markers in the diagnosis and monitoring of Type 2 Diabetes Mellitus.A Saliva tem atualmente um vasto background de investigação sobre como pode espelhar o estado de saúde do corpo. Já foram identificados biomarcadores salivares específicos para múltiplas doenças e são particularmente úteis para a monitorização de medicamentos. A saliva é um tipo de amostra particularmente favorável para a deteção de doenças infeciosas. Trata-se de um fluído não-invasivo, indolor e passível de auto recolha, ideal para estudar diferentes aspetos de duas doenças pandémicas conhecidas: COVID-19 e Diabetes Mellitus Tipo 2.
A COVID-19 é uma das pandemias mais impactante de todos os tempos, exigindo testes frequentes às populações. A necessidade de identificar estratégias rentáveis para a deteção do surto de SARS-CoV-2 tornou-se uma prioridade global. As amostras nasofaríngeas foram consideradas como o padrão de amostragem, apesar de requerem um profissional de saúde qualificado para efetuar a colheita além de causar desconforto e dor ao doente. Uma vez que a saliva demonstrou ser bem-sucedida na deteção da SARS-CoV-2, o próximo passo seria criar uma estratégia de pools de amostras com vista a diminuir o número de testes individuais e de resíduos de materiais perigosos, o que também seria benéfico para o ambiente. Esta estratégia foi testada em duzentas e setenta e nove amostras de saliva com pools de 10 e 20 amostras aleatórias. O Cycle-Threshold médio dos genes detetados foi de 29,7. Reações de RT-PCT consecutivas em amostras positivas mostraram reprodutibilidade. A análise de comparação de amostras positivas individualizadas mostrou uma carga viral mediana mais elevada em amostras de saliva comparativamente a amostras nasofaríngeas. Concluímos que as amostras de saliva-pool permitiram um rastreio eficaz da SARS-CoV-2 em pools de 10 e de 20 amostras. Esta estratégia foi aplicada com sucesso em testes populacionais de mais de 2000 indivíduos, mostrando que é possível utilizar saliva em pool como líquido de diagnóstico para a infeção pelo SARS-CoV-2.
Está demonstrado que a deteção de SARS-CoV-2 está bem estabelecida e com metodologias fiáveis, incluindo a saliva como fluido de deteção. No entanto as alterações moleculares induzidas por este vírus continuam por desvendar. Desenvolvemos uma estratégia proteómica híbrida para estabelecer um perfil proteico salivar COVID-19. As proteínas que mostram uma maior distinção entre amostras saudáveis e COVID-19 foram definidas através da análise PLS-DA e de enriquecimento funcional. Paralelamente, foram previstas as interações proteína-proteína entre o vírus e o hospedeiro. Foram identificados cinco processos biológicos desregulados no perfil do proteoma COVID-19: Apoptose, Vias de Energia, Resposta Imune, Metabolismo de Proteínas, e Transporte. Foram identificadas 10 proteínas (KLK 11, IMPA2, ANXA7, PLP2, IGLV2-11, IGHV3-43D, IGKV2-24, TMEM165, VSIG10 e PHB2) que nunca tinham sido associadas à infeção por SARS-CoV-2, representando novas provas do perfil molecular por detrás da COVID-19. A análise de interactómica mostrou influência do vírus na resposta imunitária do hospedeiro, principalmente através da interação com a desgranulação dos neutrófilos. A partir destes resultados, é possível concluir que o vírus altera não só a resposta imune, mas também o metabolismo energético do hospedeiro e interfere com os mecanismos de apoptose.
A Diabetes Mellitus Tipo 2 é uma doença metabólica crónica e constitui um risco de saúde importante devido às suas complicações características a longo prazo. Estima-se que cerca de 537 milhões de pessoas vivem com diabetes em todo o mundo e continuarão a aumentar. O diagnóstico e a monitorização da glicose na diabetes estão atualmente bem estabelecidos. Contudo, a monitorização de muitas das complicações da diabetes continua a ser um desafio, comprometendo o prognóstico e a qualidade de vida dos pacientes. Tivemos como objetivo estabelecer uma estratégia híbrida que identificou os marcadores salivares do T2DM e as suas complicações. Da análise funcional destacamos processos metabólicos, resposta a estímulos, processos do sistema imunitário e sinalização como processos biológicos perturbados pela relação conhecida com o T2DM. A análise de enriquecimento identificou 11 processos biológicos desregulamentados em que demos destaque a 20 proteínas diretamente relacionadas com complicações na diabetes. A retinopatia diabética, síndrome metabólica, resistência à insulina, impacto molecular da glicose e desregulação da homeostase da insulina, aterosclerose, úlcera do pé diabético, catabolismo proteico e função da glândula salivar são complicações diabéticas capazes de serem monitorizadas usando saliva. Concluímos que a saliva tem o potencial de identificar proteínas alteradas em doentes diabéticos em comparação com não diabéticos e que podem ser biomarcadores não só da diabetes, mas também das diferentes complicações desta doença.
Em conclusão, com esta investigação confirmamos o potencial da saliva como fluido de interesse tanto no diagnóstico como na descoberta de novos insights sobre doenças. A saliva foi crucial para demonstrar a flexibilidade e capacidade de seu uso demonstrada pelo desenvolvimento de uma deteção confiável de SARS-CoV-2, a identificação e discussão de aspetos moleculares da infeção viral no hospedeiro e com o hospedeiro, bem como a descoberta de novos marcadores no diagnóstico e monitorização da Diabetes Mellitus tipo 2
Interactómica da cavidade oral em doença periodontal
Introdução: A proteómica é a área da biotecnologia que estuda o conjunto de proteínas de uma amostra biológica, particularmente as suas estruturas e funções. Na cavidade oral podemos assinalar uma grande variedade de proteínas humanas que na doença periodontal podem estar alteradas pela interação com as proteínas produzidas pelos microrganismos presentes na patologia. As ferramentas bioinformáticas têm um papel muito importante no fornecimentos e análise de dados que permitem estabelecer o interactoma das proteínas entre o hospedeiro-microbiota.
Objectivo: Analisar in silico os dados obtidos através de ferramentas bioinformáticas; Estabelecer o interactoma oral em periodontite crónica; Identificar os processos biológicos alterados no hóspedeiro, ao nivel do proteoma oral, pela presença de microrganismos; Identificar proteínas-chave envolvidas na doença periodontal;
Materiais e Métodos: Foram utilizadas ferramentas informáticas, tais como o OralCard, Oralint e Cytoscape. Através do OralCard foi possível a obtenção das listagens das proteínas humanas e microbianas presentes na cavidade oral em periodontite crónica. Para verificar as interações entre as proteínas humanas e microbianas foi utilizado o Oralint, sendo que com o Cytoscape verificou-se com detalhe essa interação através da respresntação da rede complexa de interações entre as proteínas. A interpretação funcional das interações determinadas foi feita com o auxílio da ferramenta AgBase de onde foi retirada a anotação das proteínas.
Resultados e Discussão: Das 1071 proteínas catalogadas no OralCard, 1039 são humanas e 31 são microbianas. Foram selecionados os dois processos biológicos mais relevantes para a doença, designadamente Organização da matriz extracelular e Funcionamento do sistema imunitário, o que nos reduziu a amostra para 50 proteínas humanas e 7 microbianas. A maior parte das proteínas humanas apresentou regulação positiva que, através da interacção, poderão contribuir para a progressão da doença, para o controlo da infecção ou para restabelecer o equilíbrio no hospedeiro Conclusões e Trabalhos futuros: Com a presente dissertação, conseguiu-se identificar um conjunto de proteínas que poderão ser importantes para o desenvolvimento e o controlo da periodontite crónica. No futuro serão necessários mais estudos efetivos que clarifiquem melhor as funções de cada proteína e que as relacionem diretamente com a patologia.Introduction: Proteomics is the field of biotechnology that analysis the entire set of proteins of a biological sample, particularly their structures and functions. In the oral cavity there are a wide variety of human proteins, which in the case of periodontal disese may be altered due to the interaction with the pathogen-produced proteins. Bioinformatic tools have an important role in providing and analysing data that allow the establishment of the host-microbe interactome.
Objective: In silico analysis through bioinformatic tools; Establishment of the interactome during cronic peridonditis; Identification of the alterations in biological processes of the host oral cavity induced by the presence of microorganisms; Identication os key-proteins involved in periodontal disease.
Materials and Methods: Three bioinformnatic tools were used: OralCard, Oralint and Cytoscape. OralCard was used to list human and microbial proteins present in the oral cavity of patients with cronic periodonditis. Oralint was used to verify protein-protein interactions and Cytoscape to represent the complex network of interactions. Functional annotation was performed with AgBase.
Results and Discussion: A total of 1071 proteins were catalogued in the OralCard. From these, 1039 were human and 31 microbial. The two most relevant biological processes selected were: Extracellular matrix organization and Immune system process, thus reducing the sample number to 50 human and 7 microbial proteins. The majority of the human proteins was up-regulated and, through the interaction, may contribute do disease progression, infection control or for the re-establishment of the host equilibrium.
Conclusions and Future Works: In this study a set of proteins was identified which might be important for the development and control of cronic periodonditis. More effective studies will be needed in the future to better clarify the function of each protein during the pathology
Biomarkers in Canis lupus familiaris
Mestrado em MicrobiologiaIntrodução- Os animais de companhia como o cão desempenham hoje um
papel a nível familiar e social importante podendo atuar como agentes em
programas terapêuticos e de socorrismo.
A qualidade de vida dos animais de companhia e o correspondente impacto na
saúde pública pode beneficiar com o diagnóstico precoce e a intervenção
terapêutica adequada.
Com a evolução das abordagens Ómicas, nomeadamente dos estudos de
proteómica foi gerado um grande volume de dados que retratam o perfil de
proteínas característico de diversas situações patológicas. No entanto a
informação gerada encontra-se dispersa por inúmeros artigos científicos e
também por bases de dados diversas. A reunião de toda a informação
molecular disponível numa única base de dados permitirá a integração da
informação existente, facilitando estudos que visem encontrar os mecanismos
moleculares subjacentes a patologias bem como encontrar biomarcadores que
permitam o diagnóstico precoce de patologias.
Objetivo- Este trabalho tem como objetivo criar uma base de dados que reúna
toda a informação existente sobre os proteomas parciais de Canis lupus
familiaris, o CanisTecOme. Com a construção da estrutura da base de dados
CanisTecOme é demonstrada através de análises diversas in silico, a
metodologia a seguir para extrair informação diversa sobre as proteínas
implicadas em patologias de cão.
Estando interessados em estabelecer a saliva como fluido de diagnóstico não
invasivo, foi também objetivo desta tese o estabelecimento da metodologia
para a recolha, armazenamento e caracterização de amostras de saliva de
cão.
Materiais e métodos- A base de dados CanisTecOme foi construída por
recurso a revisão e anotação manual sobre a informação relativa à
caracterização do individuo dador, tipo de amostra biológica, técnicas
utilizadas para a identificação da proteína, e toda a informação conhecida
sobre cada uma das proteínas catalogada na base de dados. O CanisTecOme
tem também anotado as proteínas que já foram propostas como
biomarcadores para patologias diversas.
A metodologia para o estabelecimento da recolha, armazenamento e
caracterização das amostras de saliva de cão foi baseada na já estabelecida
para a saliva humana.
Conclusão- A estrutura proposta para a base de dados CanisTecOme permite
responder a questões como identificar:
- As patologias em cão para as quais existe informação sobre as
proteínas implicadas;
- Os mecanismos moleculares comprometidos em patologias;
- A saliva contém proteínas que permitam identificar patologias
sistémicas?
No que diz respeito à metodologia estabelecida para a recolha,
armazenamento e caracterização de amostras de saliva esta mostrou-se com
a qualidade adequada para o estabelecimento de um futuro biobanco de saliva
animal.Introduction – Pets such as the dog are important for families and for society
in general acting as therapeutic agents and rescue aids.
Pets quality of life and the correspondent effect on public health may benefit
from early diagnostics and targeted therapeutic actions.
The evolution of the Omics sciences, including proteomics resulted in the
accumulation of a large volume of data reflecting the protein profile of different
pathological situations. However, the information generated is dispersed
throughout several scientific articles and data bases. Collecting all information
in a single database allows data integration and management used in studies
to find molecular biomarkers for early diagnosis.
Goal - To create a database with all information on the partial proteomes of
Canis lupus familiaris, the CanisTecOme. The methodology to be used in for
data management and information gathering using the CanisTecOme database
is demonstrated through different in silico analysis.
A second objective of this work was the outlining of the basic methodology for
dog saliva collection, storage and characterization. This allows the use of saliva
as a minimally invasive diagnostic fluid.
Materials and methods – Manual curation and annotation of all the
information related to the saliva donor, biological sample, techniques used for
protein identification and all the information related to the protein identifies was
performed. The CanisTecOme has also indicated whether a protein has
already been proposed as a biomarker.
The methodology for the establishment of the sampling, storage and sample
characterization of dogs saliva was based on what is already established for
human saliva.
Conclusion – The structure proposed for the database enables the answer to
the following questions:
-Which proteins have been identified in the dog as being present in a
pathology?
- Which molecular mechanisms are compromised in a pathological situation?
- Are there protein in saliva which allow the identification of systemic
pathologies in the dog?
Furthermore, the methods used for sampling, transport and storage of saliva
were adequate for the establishment of a saliva biobank for animal saliva
Modélisation prédictive des interactions entre bactéries et virus bactériophages
Actuellement, il existe un grave problème de santé publique dû au fait que les bactéries développent des résistances aux antibiotiques, notamment à cause de la surconsommation d’antibiotiques. Achetés en pharmacie, consommé dans les hôpitaux ou indirectement via la nourriture que l’être humain consomme tous les jours, la consommation de ceux-ci ne cesse de s’accroitre. La phagothérapie, ou le traitement par bactériophages est une alternative prometteuse aux antibiotiques, qui consiste à utiliser des virus « mangeurs » de bactéries pour soigner diverses infections d’origine bactérienne. Cette technique de soins possède plusieurs des avantages des antibiotiques sans ses inconvénients, puisque les bactériophages sont très spécifiques et ne s’attaquent par conséquent qu’aux bactéries à l’origine de l’infection, évitant ainsi les effets secondaires dû à la consommation d’antibiotiques par exemple sur la flore intestinale. Le défi lié à cette technique consiste à identifier rapidement le ou les bactériophages capables d’attaquer une bactérie en particulier, une procédure actuellement réalisée en laboratoire en testant toutes les combinaisons possibles, ce qui est coûteux et nécessite plusieurs jours.
La solution explorée dans ce projet consiste en l’utilisation de techniques computationnelles pour prédire in silico si une paire bactérie-bactériophage est capable d’interagir ou pas. Parti d’une base de données contenant plus de 1'000 paires bactérie-bactériophage positives et plus de 1'000 paires négatives pour lesquelles le génome de la bactérie et du bactériophage sont connus, la procédure suivante a été mise en place:
1. Extraction de variables pour créer 19 sets de données utilisés pour entraîner les modèles d’apprentissage automatique ;
2. Sélection et entrainement des algorithmes avec un grand nombre de configurations;
3. Recours à l’approche d’agrégation de modèle pour élaborer un système de votation ;
4. Analyse des résultats.
Le modèle final qui a été développé a permis d’atteindre une performance de plus de 90% d’accuracy, de mesure F1, de sensibilité et de spécificité sur un set de validation (test set) qui n’avait jamais été utilisé ni pour l’entraînement ni pour la validation croisée. Les bons résultats permettent d’affirmer que l’utilisation de l’apprentissage automatique semble être une approche prometteuse pour répondre à ce problème.Currently, there is a serious public health problem because bacteria develop resistance to antibiotics, particularly because of the overuse of antibiotics. Purchased in pharmacies, consumed in hospitals or indirectly via the food that humans consume daily, the consumption of these continues to increase. Phage therapy, i.e. treatment with bacteriophages, is a promising alternative to antibiotics, which involves the use of viruses, which are literally "eaters" of bacteria, to treat various infections caused by bacteria. This treatment technique has several of the advantages of antibiotics, without their drawbacks. Indeed, bacteriophages are highly specific and therefore only attack bacteria causing the infection, avoiding side effects due to antibiotics consumption, e.g. on the intestinal flora. The challenge of this technique is to quickly identify the bacteriophages that attack a particular bacterium, a procedure currently performed in laboratories by testing all possible combinations, which is expensive and requires several days.
The solution explored in this project is the use of computational techniques to predict whether a pair of bacteriophage-bacterium is able to interact or not in silico. For a database containing more than 1,000 positive pairs of bacteria-bacteriophage and over 1,000 negative pairs for which the genome of both the bacterium and the bacteriophage are known, the following procedure has been put in place:
1. Extraction of features to create 19 datasets used to train machine learning models;
2. Selection and training of the algorithms with a large number of configurations;
3. Use of ensemble-learning modeling approaches to develop a voting system;
4. Results analysis.
The final model that was developed has achieved a performance of more than 90% accuracy, measurement F1, sensitivity and specificity on a validation set (test set) that had never been used for training nor for cross-validation. These good results let us conclude that the use of machine learning seems to be a promising approach to address this problem