11 research outputs found

    Hunter-Gatherer-Annotator science : characterizing regulatory elements in the genome of dog and zebrafish with public and not yet public data

    Get PDF
    In order to study gene regulation, large amounts of sequencing data are necessary. We can either generate (hunt) them ourselves or use (gather) publicly available data sets. In order to guarantee the reliability and reusability of the hunted and gathered data, we need to also annotate them with the correct metadata. In this thesis, I will touch on all three of these aspects. I was part of two international consortia which applied these approaches to two different model organisms. The DANIO-CODE consortium was initiated to systematically annotate the zebrafish genome. Similarly, the Dog Genome Annotation (DoGA) project aims to improve the annotation of genomic elements in the dog genome. Both zebrafish and dogs are popular model organisms for studying biological processes and pathologies in humans. Despite their popularity, both organisms lack a large-scale annotation of regulatory elements. Before analyzing any data, we designed an annotation structure that captures all aspects of a sequencing experiment that are essential for the processing and analysis of the data. We implemented this structure in a web-platform, which allows easy upload, query, and download of the sequencing data and associated metadata. We present the structure and implementation in Study I, which also contains a comparison to similar and well-established annotation schemata. We use this annotation structure and the web platform for Study II to collect sequencing data from 1,803 samples from 38 different research groups looking from transcriptomic, epigenomic, and methylomic perspectives at different stages of zebrafish development. We identified more than 140,000 new cis-regulatory elements active during development and provide them together with the sequencing data and genome browser tracks as a resource for the community. In Study III, we present a biobank for dog tissues established for the DoGA consortium. For both Study III and Study IV, we used 88 and 37 tissues from the biobank, respectively, to catalog promoter regions and their tissue activity using STRT and CAGE-seq. In Study III we also present the web-platform, based on the structure in Study I, where we make the data and the corresponding metadata available. In Study IV, we used the data from CAGE-seq to also identify active enhancer regions and their corresponding tissue activity. We identify regulatory networks between enhancers and promoters and show their conservation in human

    Analyse von HerzratenvariabilitÀt durch Datenmodelle von Poincaré Plots

    No full text
    Abweichender Titel laut Übersetzung der Verfasserin/des VerfassersZsfassung in dt. SpracheHerzerkrankungen sind eine der hĂ€ufigsten Todesursachen in den industrialisierten LĂ€ndern der Welt. Aufgrund der KomplexitĂ€t des Herzkreislaufsystems suchen Forscher*innen nach Indikatoren fĂŒr den gesundheitlichen Zustand des Systems. Einer von diesen Indikatoren ist die HerzratenvariabilitĂ€t (HRV), d.h. die VerĂ€nderung der Zeitintervalle zwischen zwei HerzschlĂ€gen. Die HRV liefert Anhaltspunkte ĂŒber den Zustand verschiedenster physiologischer Prozesse, die Einfluss auf den Herzrhythmus haben. Nachdem die Entstehung von HerzschlĂ€gen ein nichtlinearer Prozess ist, wurde in den letzten 20 Jahren vermehrt auf den PoincarĂ© Plot zurĂŒckgegriffen, eine Visualisierungsmethode, die ihren Ursprung in der Chaostheorie hat und auch als Lorenz Plot bekannt ist. Es ist eine einfache Darstellungsweise der Änderung der Herzrate von einem Herzschlag zum nĂ€chsten und findet zahlreiche Anwendungen in der Medizin, u.a. zur Vorhersage des MortalitĂ€tsrisikos bei Patient*innen nach einem Myokardinfarkt. Es existieren verschiedenste Datenmodelle zur automatischen Quantifizierung des PoincarĂ© Plots. Ziel dieser Diplomarbeit war es 14 der gebrĂ€uchlichsten Modelle in MATLAB zu implementieren und falls möglich zu verbessern, sowie die Untersuchung ihrer FĂ€higkeit, verschiedene Arten von pathologischen und nicht pathologischen Herzraten zu unterscheiden, der Vergleich zu statistischen HRV-GrĂ¶ĂŸen und die Betrachtung der AbhĂ€ngikeit der Datenmodelle zueinander. Die Daten des PoincarĂ© Plots werden mittels Clusteralgorithmen gefiltert und anschließend in vier TestfĂ€llen verwendet. Der erste Test untersucht die Empfindlichkeit der Modelle auf die DatenlĂ€nge. Dazu wird die UnterscheidungsfĂ€higkeit zwischen pathologischen und nicht pathologischen Daten bei sich schrittweise verkĂŒrzenden DatenlĂ€ngen betrachtet. Im zweiten Testfall werden die Ergebnisse der Modelle fĂŒr pathologische und nicht pathologische Daten bei einer fixen DatenlĂ€nge genauer untersucht. FĂŒr den dritten Test werden Herzratendaten von Arrhythmiepatienten vor und nach einer Antiarrhythmikabehandlung verwendet und erneut die FĂ€higkeit der Modelle zwischen den DatensĂ€tzen zu unterscheiden getestet. Im letzten Test werden die Ergebnisse der Modelle zwischen Ă€lteren und jĂŒngeren gesunden Patient*innen untersucht. Manche, jedoch nicht jedes der implementierten Datenmodelle zeigten signifikant unterschiedliche Ergebnisse zwischen den betrachteten DatensĂ€tzen. Darunter ist auch ein Modell, das im Zuge dieser Diplomarbeit verbessert wurde. Anhand der berechneten Korrelationen lĂ€sst sich die Anzahl an zu berĂŒcksichtigenden Modellen fĂŒr kĂŒnftige Untersuchungen reduzieren.Heart diseases are amongst the most common causes of death in the industrialized world. Since the cardiological system is very complex and hard to capture in its entirety, researchers are looking for indicators of its health. One of these is the heart rate variability (HRV), i.e. the variation of the time interval between two heart beats. It reflects many physiological processes which influence the rhythm of the heart. Since these influences of the generation of heart beats are non-linear, researchers use a visualization tool, the PoincarĂ© plot, which has its origins in chaos theory, to analyze HRV. This method, also called Lorenz plot, became popular in the last 20 years. It gives a simple visualization of the heart's beat-to-beat behavior and can be used for various applications, e.g., to predict the mortality of patients with myocardial infarction. Numerous data models exist in order to automatically quantify PoincarĂ© plots. The main objective of this master thesis is to implement 14 of the most common models in MATLAB and improve them where possible. Afterwards these models are tested with respect to their ability to differentiate between pathological and non-pathological heart beat recordings, compare them to statistical HRV-measures and examine the models' dependences on each other. The data are filtered via clustering algorithms and used in four different test cases. The first case is to test for data length sensitivity. Therefore, each model is applied to non-pathological and pathological data sets, with a stepwise reduction of their data length. The second case is an application of the models on pathological and non-pathological data sets, at a fixed data length, in order to do a deeper examination of them and their ability to differentiate between these data sets. For the third test, the models are used on data sets of subjects before and after arrhythmia treatment. The final test case is a comparison of younger and older healthy subjects via the data models. Although not all implemented data models showed significant differences between the tested data sets, some passed all tests, including one, which was improved for this thesis. With the calculated correlations, the number of models which should be considered for further research can also be reduced.7

    Der genetische Hintergrund von Calciumsignalen: Eine bioinformatische und experimentelle Studie

    No full text
    Abweichender Titel laut Übersetzung der Verfasserin/des VerfassersZsfassung in dt. SpracheKalzium, genauer gesagt das Kalzium Ion Ca2+, stellt eines der grundlegendsten Signale innerhalb einer einzelnen Zelle aber auch zwischen mehreren benachbarten Zellen dar, dabei fungiert der Kalziumspiegel als InformationstrĂ€ger. Die erste Zellteilung, die Kontraktion von Muskelfasern, die Speicherung von Erinnerung und der programmierte Zelltod, all das sind nur einige Beispiele der unzĂ€hligen VorgĂ€nge in einem Organismus, die durch den Kalziumgehalt in Zellen gesteuert werden. Trotz dieser zentralen Rolle, ist wenig ĂŒber den genetische Hintergrund des Kalziumsignalfunktionen bekannt, insbesondere in Hinsicht auf Krankheiten. Diese Arbeit besteht aus zwei Teilen, die die Verbindung zwischen Genen und Kalziumsignalen aus zwei verschiedenen Richtungen betrachtet. Im ersten Teil wurden ein bioinformatischer Ansatz gewĂ€hlt um alle Gene, die mit Kalziumsignalen verknĂŒpft sein könnten, als auch die mit ihnen verbundenen Krankheiten zu bestimmen. Die daraus entstandene Datenbank CaGeDB stellt dabei den ersten Versuch dar, eine Datenbank zu erstellen, die Gene, die mit Kalziumsignalen in Verbindung gebracht werden, sowie den mit diesen Genen in Verbindung gebrachten Krankheiten, zu sammeln. Dazu wurden zuerst fĂŒr Kalziumsignale relevante Begriffe, die in Gendatenbanken verwendet werden um die Genfunktion zu beschreiben, ausgewĂ€hlt. Anhand dieser wurden dann zwei Gendatenbanken abgefragt und die daraus resultierenden Ergebnisse miteinander abgeglichen. Anschließend wurde eine weitere Datenbank verwendet um Krankheiten, die mit diesen Genen in Verbindung gebracht werden, zu finden. Um diese Krankheiten besser handhaben zu können, wurde eine zusĂ€tzliche Datenbank benutzt, mittels derer die Krankheitsbegriffe gruppiert werden konnten. Insgesamt umfasst die resultierende Datenbank, CaGeDB, 1597 Gene und 1409 verschiedene Krankheiten und ist unter uhlenlab.org/cagedb erreichbar. Im zweiten Teil der Arbeit wurden experimentelle Mittel gewĂ€hlt um eine mögliche Verbindung zwischen dem Gen SNCA und Kalziumsignalen genauer zu untersuchen. Das Gen SNCA stellt das Rezept fĂŒr das Protein a-Synuclein dar, welches eine Rolle bei der Parkinson Krankheit spielt. Die genaue Funktion dieses Proteins ist noch unbekannt, es gibt jedoch Indizien die darauf hinweisen, dass es eine Rolle in der Regulierung das Kalziumspiegels innerhalb der Mitochondrien spielt. Dieser Aspekt wurde in dieser Arbeit genauer untersucht, dabei wurde ausgenutzt, dass die Mitochondrien nicht nur Energie fĂŒr die Zellen produzieren, sondern auch den programmierten Zelltod einleiten. Dazu wurden zuerst sogenannte HeLa Zellen, eine sehr robuste Zellkultur menschlichen Ursprungs, gezĂŒchtet und anschließend Genmaterial eingeschleust, welches die korrekte Auslese des Gens SNCA unterdrĂŒckt. Danach wurde per Fluoreszenzmikroskop untersucht, wie sich diese VerĂ€nderung auf den durch KalziumĂŒberschuss eingeleiteten Zelltods auswirkt. Hierbei zeigte sich, dass jene Zellen bei denen SNCA unterdrĂŒckt wurde, signifikant hĂ€ufiger den programmierten Zelltod einleiten. Nachdem dies auf eine gestörte Regulation des Kalziumspiegels zurĂŒckgefĂŒhrt werden kann, stellt dieses Resultat ein weiteres Indiz dafĂŒr da, dass a-Synuclein an der Kontrolle des Kalziumhaushalts beteiligt ist.The calcium ion (Ca2+) is one of the key components of intercellular and intracellular signaling. From the first cell division, to the contraction of muscle fibres, to the formation of memories, to cell death, all these processes are governed by changing amounts of intracellular Ca2+. Despite the central function of this ion, little is known about the genetic background of the Ca2+ signaling toolkit, especially its link to human diseases. This thesis, separated into two parts, approaches genes connected to Ca2+ signaling from two different stand points. In the first part, a bioinformatic approach was chosen, to determine all genes with a possible connection to Ca2+ signaling, as well as diseases associated with these genes. Here we present the Calcium Gene Database (CaGeDB), the first attempt to establish a comprehensive database linking genes to Ca2+ signaling and their associated diseases. Initially, possible gene database annotation terms were selected. These were then used to query two genome databases. After merging the resulting genes, a database mapping genes to diseases was queried. To improve the handling of the data, another database which provides a hierarchical structure for diseases was used. All data is acquired automatically by scripts written for this thesis. CaGeDB contains 1597 genes which are connected to 1409 different diseases and disease categories and is available at uhlenlab.org/cagedb. For the second part, an experimental approach using cell lines to examine the relation between the gene SNCA, which is involved in Parkinson's Disease and Ca2+ signaling was chosen. Here we show that cells with a suppressed SNCA expression had a significantly higher rate of Ca2+ induced cell death compared to normal cells. In order to show this, HeLa cells were cultured and then transfected with DNA to suppress the expression of SNCA. Afterwards the effects of this suppression with respect to Ca2+ signals and especially Ca2+ induced cell death were tested using wide field fluorescence microscopy. Because the concentration of Ca2+ in the mitochondria is a key component in the initiation of cell death, the results strengthen the hypothesis that a-synuclein is involved in the mitochondrial Ca2+ homeostasis. Both parts, the first one as a general discovery tool and the second one providing further knowledge about a specific gene and its role in Ca2+ signaling shed new light on the role genes play with respect to Ca2+ signals.4

    Ökobilanzierung biologischer Lebensmittel

    No full text
    Das Faktenblatt stellt das Instrument der produktbezogenen Ökobilanz vor, wie es bisher zur AbschĂ€tzung der ökologischen Nachhaltigkeit in der Land- und Lebensmittelwirtschaft verwendet wird. Anhand von eigenen und fremden Berechnungen analysieren die Autoren die Aussagekraft vergleichender Ökobilanzen von Lebensmitteln aus extensiven mit solchen aus intensiveren Produktionssystemen. Im Interesse einer umfassenden Umweltbewertung der Lebensmittelproduktion schlagen die Autoren substantielle Erweiterungen der bisherigen Methode auf verschiedenen Ebenen vor

    Life cycle assessments of organic foods

    No full text
    The fact sheet presents the tool of the product-related life cycle assessment as it is currently used for assessing ecological sustainability in the food and farming sector. Based on internal and external calculations, the authors analyse the meaningfulness of comparative life cycle assessment of food from extensive production systems with those from more intensive production systems. In the interest of a comprehensive environmental assessment of food production, the authors propose substantial extensions of the existing method at different levels

    Effect of three husbandry systems on environmental impact of organic pigs

    No full text
    This study examined the environmental impact of the three common organic pig husbandry systems, indoor (n = 24), partly outdoor (n = 30), and outdoor (n = 10), in eight European countries. Global warming (GWP), acidification (AP), and eutrophication potential (EP) was assessed per 1000 kg pig live weight on 64 farrow-to-finish pig production chains (cradle to farm gate). GWP, AP, and EP varied greatly, and the most important source was feed production, followed by housing. GWP did not differ between systems (p = 0.934), but AP in indoor systems and EP in outdoor systems were higher than in partly outdoor systems (p = 0.006 and p = 0.010, respectively). The higher AP in indoor systems can mainly be explained by NH3 arising from manure spreading, while PO4-eq arising from feed consumption and emissions on pasture accounted for the higher EP in outdoor systems. Associations of farm characteristics with (reduced) environmental impacts were mainly found for AP and EP, and included: (Increasing) farm size, numbers of piglets born and weaned per litter, (bought-in) mineral feed, and high-protein by-products, the latter probably connected to beneficial effects of appropriate dietary digestible lysine levels and feed conversion ratio. Increasing carcass weights and dietary cereal proportions were associated with higher environmental impacts. Overall, variation was mostly higher within than between systems, and measures to mitigate environmental impact were identified
    corecore