60 research outputs found
Active transitivity clustering of large-scale biomedical datasets
Clustering is a popular computational approach for partitioning data sets into groups of objects that share common traits. Due to recent advances in wet-lab technology, the amount of available biological data grows exponentially and increasingly poses problems in terms of computational complexity for current clustering approaches. In this thesis, we introduce two novel approaches, TransClustMV and ActiveTransClust, that enable the handling of large scale datasets by reducing the amount of required information drastically by means of exploiting missing values.
Furthermore, there exists a plethora of different clustering tools and standards making it very difficult for researchers to choose the correct methods for a given problem. In order to clarify this multifarious field, we developed ClustEval which streamlines the clustering process and enables practitioners conducting large-scale cluster analyses in a standardized and bias-free manner.
We conclude the thesis by demonstrating the power of clustering tools and the need for the previously developed methods by conducting real-world analyses. We transferred the regulatory network of E. coli K-12 to pathogenic EHEC organisms based on evolutionary conservation therefore avoiding tedious and potentially dangerous wet-lab experiments. In another example, we identify pathogenicity specific core genomes of actinobacteria in order to identify potential drug targets.Clustering ist ein populärer Ansatz um Datensätze in Gruppen ähnlicher Objekte zu partitionieren. Nicht zuletzt aufgrund der jüngsten Fortschritte in der Labortechnik wächst die Menge der biologischen Daten exponentiell und stellt zunehmend ein Problem für heutige Clusteralgorithmen dar. Im Rahmen dieser Arbeit stellen wir zwei neue Ansätze, TransClustMV und ActiveTransClust, vor die auch das Bearbeiten sehr großer Datensätze ermöglichen, indem sie den Umfang der benötigten Informationen drastisch reduzieren da fehlende Werte kompensiert werden können.
Allein die schiere Vielfalt der vorhanden Cluster-Methoden und Standards stellt den Anwender darüber hinaus vor das Problem, den am besten geeigneten Algorithmus für das vorliegende Problem zu wählen. ClustEval wurde mit dem Ziel entwickelt, diese Unübersichtlichkeit zu beseitigen und gleichzeitig die Clusteranalyse zu vereinheitlichen und zu automatisieren um auch aufwendige Clusteranalysen zu realisieren.
Abschließend demonstrieren wir die Nützlichkeit von Clustering anhand von realen Anwendungsfällen die darüber hinaus auch den Bedarf der zuvor entwickelten Methoden aufzeigen. Wir haben das genregulatorische Netzwerk von E. coli K-12 ohne langwierige und potentiell gefährliche Laborarbeit auf pathogene EHEC Stämme übertragen. In einem weiteren Beispiel bestimmen wir das pathogenitätsspeziefische „Kerngenom“ von Actinobakterien um potenzielle Angriffspunkte für Medikamente zu identifizieren
In silico identification of essential proteins in Corynebacterium pseudotuberculosis based on protein-protein interaction networks
Background Corynebacterium pseudotuberculosis (Cp) is a gram-positive bacterium that is classified into equi and ovis serovars. The serovar ovis is the etiological agent of caseous lymphadenitis, a chronic infection affecting sheep and goats, causing economic losses due to carcass condemnation and decreased production of meat, wool, and milk. Current diagnosis or treatment protocols are not fully effective and, thus, require further research of Cp pathogenesis. Results Here, we mapped known protein-protein interactions (PPI) from various species to nine Cp strains to reconstruct parts of the potential Cp interactome and to identify potentially essential proteins serving as putative drug targets. On average, we predict 16,669 interactions for each of the nine strains (with 15,495 interactions shared among all strains). An in silico sanity check suggests that the potential networks were not formed by spurious interactions but have a strong biological bias. With the inferred Cp networks we identify 181 essential proteins, among which 41 are non-host homologous. Conclusions The list of candidate interactions of the Cp strains lay the basis for developing novel hypotheses and designing according wet-lab studies. The non-host homologous essential proteins are attractive targets for therapeutic and diagnostic proposes. They allow for searching of small molecule inhibitors of binding interactions enabling modern drug discovery. Overall, the predicted Cp PPI networks form a valuable and versatile tool for researchers interested in Corynebacterium pseudotuberculosis
CMRegNet-An interspecies reference database for corynebacterial and mycobacterial regulatory networks
BACKGROUND: Organisms utilize a multitude of mechanisms for responding to changing environmental conditions, maintaining their functional homeostasis and to overcome stress situations. One of the most important mechanisms is transcriptional gene regulation. In-depth study of the transcriptional gene regulatory network can lead to various practical applications, creating a greater understanding of how organisms control their cellular behavior. DESCRIPTION: In this work, we present a new database, CMRegNet for the gene regulatory networks of Corynebacterium glutamicum ATCC 13032 and Mycobacterium tuberculosis H37Rv. We furthermore transferred the known networks of these model organisms to 18 other non-model but phylogenetically close species (target organisms) of the CMNR group. In comparison to other network transfers, for the first time we utilized two model organisms resulting into a more diverse and complete network of the target organisms. CONCLUSION: CMRegNet provides easy access to a total of 3,103 known regulations in C. glutamicum ATCC 13032 and M. tuberculosis H37Rv and to 38,940 evolutionary conserved interactions for 18 non-model species of the CMNR group. This makes CMRegNet to date the most comprehensive database of regulatory interactions of CMNR bacteria. The content of CMRegNet is publicly available online via a web interface found at http://lgcm.icb.ufmg.br/cmregnet
Clustering of Biological Datasets in the Era of Big Data
Clustering is a long-standing problem in computer science and is applied in virtually any scientific field for exploring the inherent structure of datasets. In biomedical research, clustering tools have been utilized in manifold areas, among many others in expression analysis, disease subtyping or protein research. A plethora of different approaches have been developed but there is only little guideline what approach is the optimal in what particular situation. Furthermore, a typical cluster analysis is an entire process with several highly interconnected steps; from preprocessing, proximity calculation, the actual clustering to evaluation and optimization. Only when all steps seamlessly work together, an optimal result can be achieved. This renders a cluster analyses tiresome and error-prone especially for non-experts. A mere trial-and-error approach renders increasingly infeasible when considering the tremendous growth of available datasets; thus, a strategic and thoughtful course of action is crucial for a cluster analysis. This manuscript provides an overview of the crucial steps and the most common techniques involved in conducting a state-of-the-art cluster analysis of biomedical datasets
Active transitivity clustering von großen biomedizinischen Datensätzen
Clustering is a popular computational approach for partitioning data sets into groups of objects that share common traits. Due to recent advances in wet-lab technology, the amount of available biological data grows exponentially and increasingly poses problems in terms of computational complexity for current clustering approaches. In this thesis, we introduce two novel approaches, TransClustMV and ActiveTransClust, that enable the handling of large scale datasets by reducing the amount of required information drastically by means of exploiting missing values.
Furthermore, there exists a plethora of different clustering tools and standards making it very difficult for researchers to choose the correct methods for a given problem. In order to clarify this multifarious field, we developed ClustEval which streamlines the clustering process and enables practitioners conducting large-scale cluster analyses in a standardized and bias-free manner.
We conclude the thesis by demonstrating the power of clustering tools and the need for the previously developed methods by conducting real-world analyses. We transferred the regulatory network of E. coli K-12 to pathogenic EHEC organisms based on evolutionary conservation therefore avoiding tedious and potentially dangerous wet-lab experiments. In another example, we identify pathogenicity specific core genomes of actinobacteria in order to identify potential drug targets.Clustering ist ein populärer Ansatz um Datensätze in Gruppen ähnlicher Objekte zu partitionieren. Nicht zuletzt aufgrund der jüngsten Fortschritte in der Labortechnik wächst die Menge der biologischen Daten exponentiell und stellt zunehmend ein Problem für heutige Clusteralgorithmen dar. Im Rahmen dieser Arbeit stellen wir zwei neue Ansätze, TransClustMV und ActiveTransClust, vor die auch das Bearbeiten sehr großer Datensätze ermöglichen, indem sie den Umfang der benötigten Informationen drastisch reduzieren da fehlende Werte kompensiert werden können.
Allein die schiere Vielfalt der vorhanden Cluster-Methoden und Standards stellt den Anwender darüber hinaus vor das Problem, den am besten geeigneten Algorithmus für das vorliegende Problem zu wählen. ClustEval wurde mit dem Ziel entwickelt, diese Unübersichtlichkeit zu beseitigen und gleichzeitig die Clusteranalyse zu vereinheitlichen und zu automatisieren um auch aufwendige Clusteranalysen zu realisieren.
Abschließend demonstrieren wir die Nützlichkeit von Clustering anhand von realen Anwendungsfällen die darüber hinaus auch den Bedarf der zuvor entwickelten Methoden aufzeigen. Wir haben das genregulatorische Netzwerk von E. coli K-12 ohne langwierige und potentiell gefährliche Laborarbeit auf pathogene EHEC Stämme übertragen. In einem weiteren Beispiel bestimmen wir das pathogenitätsspeziefische „Kerngenom“ von Actinobakterien um potenzielle Angriffspunkte für Medikamente zu identifizieren
Humane Autoantikörper bei Prionerkrankungen
Prionerkrankungen sind bislang nicht therapierbare, grundsätzlich tödlich verlaufende Krankheiten, die infektiösen Charakter besitzen. Dabei kommt es zur Fehlfaltung eines physiologisch vorkommenden Proteins, des zellulär exprimierten Prion Proteins PrPC. PrPC wird in eine stabile, unlösliche Form PrPSc gefaltet, welches Aggregate bilden und sich im Gehirn in Form von Prionplaques ablagern kann. Dadurch kommt es zu einem pro¬gressiven Neuronenverlust begleitet von einer profunden Mikrogliaaktivierung und ei¬ner Vakuolisierung der Hirnmasse. Studien in Zellkulturen und im Mausmodell haben ge¬zeigt, dass Immunisierungsstrategien als potentielle Therapien bei Prionerkrankun¬gen in Betracht gezogen werden können. Natürlich vorkommende Autoantikörper (nAbs) wurden schon bei der Alzheimer- und Parkinson-Erkrankung nachge¬wie¬sen und auf ihre Wirksamkeit untersucht. Die vorliegende Arbeit beschäftigt sich mit der Wirkweise von Prion-spezifischen nAbs (nAbs-PrP) in vitro bei Prion¬erkran¬kungen.
Wir konnten erstmalig nAbs-PrP gegen das Prionproteinfragment PrP106-126 A117V im Serum und CSF gesunder Probanden detektieren. Darüber hinaus konnten nAbs-PrP aus ei¬nem kommerziell erwerblichen Pool intravenöser Immunglobuline (IVIg) mit-tels Affini¬täts¬chromatographie isoliert werden. Der Nachweis von nAbs-PrP in huma-nem Serum und CSF von gesunden Spendern impliziert eine physiologische Rolle von nAbs-PrP bei der Kon¬ver¬¬sion von PrPC zu PrPSc. Tatsächlich konnte in der vor¬lie-genden Arbeit ge¬zeigt werden, dass nAbs-PrP die Fibrillenbildung des Peptids PrP106-126 A117V konzen¬tra¬tions¬abhängig inhibieren. Auch die toxische Wirkung des Peptides auf Neu¬rone konnte durch nAbs-PrP gehemmt werden, was vermutlich mit dem hemmen¬den Einfluss auf die Fibrillenbildung einhergeht. Des Weiteren konnte gezeigt werden, dass nAbs-PrP ver¬¬mutlich eine bedeutende Rolle bei der Mikroglia-vermittelten Prion-„Clearance“ spielen. Eine Behandlung der Mikrogliazellen mit nAbs-PrP führte zu einer ver¬¬stärkten Pha¬gozytose von PrP106-126 A117V, die weder in einer Induktion pro-in¬flamma¬tori¬scher Zytokine noch in einer Einschränkung der Zellvitalität resultierte. Durch den Ein¬satz verschiedener Phagozytose-Inhibitoren konnte gezeigt werden, dass wahr¬schein¬lich zwei unterschiedliche Mechanismen für die Phagozytose von fi-brilliertem Prion¬pep¬tid einerseits und für die nAbs-PrP-vermittelte Prionaufnahme anderer¬seits ver¬ant¬wort¬lich sind.
Zusammenfassend konnte in vitro gezeigt werden, dass nAbs-PrP in die patholo¬gi¬schen Prozesse der Prionkonversion und -toxizität eingreifen können. nAbs-PrP lösten dabei keine inflammatorische Reaktion in Mikrogliazellen aus, sondern wirkten fördernd auf die „Clearance“ von fibrillierten Prionpeptiden. Diese Ergebnisse legen nahe, den Effekt von nAbs-PrP auf den Krankheitsverlauf in vivo zu untersuchen
- …