9 research outputs found

    Perspectives on tracking data reuse across biodata resources

    Get PDF
    c The Author(s) 2024. Published by Oxford University Press.Motivation: Data reuse is a common and vital practice in molecular biology and enables the knowledge gathered over recent decades to drive discovery and innovation in the life sciences. Much of this knowledge has been collated into molecular biology databases, such as UniProtKB, and these resources derive enormous value from sharing data among themselves. However, quantifying and documenting this kind of data reuse remains a challenge. Results: The article reports on a one-day virtual workshop hosted by the UniProt Consortium in March 2023, attended by representatives from biodata resources, experts in data management, and NIH program managers. Workshop discussions focused on strategies for tracking data reuse, best practices for reusing data, and the challenges associated with data reuse and tracking. Surveys and discussions showed that data reuse is widespread, but critical information for reproducibility is sometimes lacking. Challenges include costs of tracking data reuse, tensions between tracking data and open sharing, restrictive licenses, and difficulties in tracking commercial data use. Recommendations that emerged from the discussion include: development of standardized formats for documenting data reuse, education about the obstacles posed by restrictive licenses, and continued recognition by funding agencies that data management is a critical activity that requires dedicated resources

    Perspectives on tracking data reuse across biodata resources.

    Get PDF
    Data reuse is a common and vital practice in molecular biology and enables the knowledge gathered over recent decades to drive discovery and innovation in the life sciences. Much of this knowledge has been collated into molecular biology databases, such as UniProtKB, and these resources derive enormous value from sharing data among themselves. However, quantifying and documenting this kind of data reuse remains a challenge. The article reports on a one-day virtual workshop hosted by the UniProt Consortium in March 2023, attended by representatives from biodata resources, experts in data management, and NIH program managers. Workshop discussions focused on strategies for tracking data reuse, best practices for reusing data, and the challenges associated with data reuse and tracking. Surveys and discussions showed that data reuse is widespread, but critical information for reproducibility is sometimes lacking. Challenges include costs of tracking data reuse, tensions between tracking data and open sharing, restrictive licenses, and difficulties in tracking commercial data use. Recommendations that emerged from the discussion include: development of standardized formats for documenting data reuse, education about the obstacles posed by restrictive licenses, and continued recognition by funding agencies that data management is a critical activity that requires dedicated resources. Summaries of survey results are available at: https://docs.google.com/forms/d/1j-VU2ifEKb9C-sW6l3ATB79dgHdRk5v_lESv2hawnso/viewanalytics (survey of data providers) and https://docs.google.com/forms/d/18WbJFutUd7qiZoEzbOytFYXSfWFT61hVce0vjvIwIjk/viewanalytics (survey of users)

    Functional implications of glycans and their curation:insights from the workshop held at the 16th Annual International Biocuration Conference in Padua, Italy

    Get PDF
    Dynamic changes in protein glycosylation impact human health and disease progression. However, current resources that capture disease and phenotype information focus primarily on the macromolecules within the central dogma of molecular biology (DNA, RNA, proteins). To gain a better understanding of organisms, there is a need to capture the functional impact of glycans and glycosylation on biological processes. A workshop titled "Functional impact of glycans and their curation" was held in conjunction with the 16th Annual International Biocuration Conference to discuss ongoing worldwide activities related to glycan function curation. This workshop brought together subject matter experts, tool developers, and biocurators from over 20 projects and bioinformatics resources. Participants discussed four key topics for each of their resources: (i) how they curate glycan function-related data from publications and other sources, (ii) what type of data they would like to acquire, (iii) what data they currently have, and (iv) what standards they use. Their answers contributed input that provided a comprehensive overview of state-of-the-art glycan function curation and annotations. This report summarizes the outcome of discussions, including potential solutions and areas where curators, data wranglers, and text mining experts can collaborate to address current gaps in glycan and glycosylation annotations, leveraging each other's work to improve their respective resources and encourage impactful data sharing among resources. Database URL: https://wiki.glygen.org/Glycan_Function_Workshop_2023

    AgBioData consortium recommendations for sustainable genomics and genetics databases for agriculture

    Get PDF
    The future of agricultural research depends on data. The sheer volume of agricultural biological data being produced today makes excellent data management essential. Governmental agencies, publishers and science funders require data management plans for publicly funded research. Furthermore, the value of data increases exponentially when they are properly stored, described, integrated and shared, so that they can be easily utilized in future analyses. AgBioData (https://www.agbiodata.org) is a consortium of people working at agricultural biological databases, data archives and knowledgbases who strive to identify common issues in database development, curation and management, with the goal of creating database products that are more Findable, Accessible, Interoperable and Reusable. We strive to promote authentic, detailed, accurate and explicit communication between all parties involved in scientific data. As a step toward this goal, we present the current state of biocuration, ontologies, metadata and persistence, database platforms, programmatic (machine) access to data, communication and sustainability with regard to data curation. Each section describes challenges and opportunities for these topics, along with recommendations and best practices

    AgBioData consortium recommendations for sustainable genomics and genetics databases for agriculture

    Get PDF
    The future of agricultural research depends on data. The sheer volume of agricultural biological data being produced today makes excellent data management essential. Governmental agencies, publishers and science funders require data management plans for publicly funded research. Furthermore, the value of data increases exponentially when they are properly stored, described, integrated and shared, so that they can be easily utilized in future analyses. AgBioData (https://www.agbiodata.org) is a consortium of people working at agricultural biological databases, data archives and knowledgbases who strive to identify common issues in database development, curation and management, with the goal of creating database products that are more Findable, Accessible, Interoperable and Reusable. We strive to promote authentic, detailed, accurate and explicit communication between all parties involved in scientific data. As a step toward this goal, we present the current state of biocuration, ontologies, metadata and persistence, database platforms, programmatic (machine) access to data, communication and sustainability with regard to data curation. Each section describes challenges and opportunities for these topics, along with recommendations and best practices

    From tools and databases to clinically relevant applications in miRNA research

    Get PDF
    While especially early research focused on the small portion of the human genome that encodes proteins, it became apparent that molecules responsible for many key functions were also encoded in the remaining regions. Originally, non-coding RNAs, i.e., molecules that are not translated into proteins, were thought to be composed of only two classes (ribosomal RNAs and transfer RNAs). However, starting from the early 1980s many other non-coding RNA classes were discovered. In the past two decades, small non-coding RNAs (sncRNAs) and in particular microRNAs (miRNAs), have become essential molecules in biological and biomedical research. In this thesis, five aspects of miRNA research have been addressed. Starting from the development of advanced computational software to analyze miRNA data (1), an in-depth understanding of human and non-human miRNAs was generated and databases hosting this knowledge were created (2). In addition, the effects of technological advances were evaluated (3). We also contributed to the understanding on how miRNAs act in an orchestrated manner to target human genes (4). Finally, based on the insights gained from the tools and resources of the mentioned aspects we evaluated the suitability of miRNAs as biomarkers (5). With the establishment of next-generation sequencing, the primary goal of this thesis was the creation of an advanced bioinformatics analysis pipeline for high-throughput miRNA sequencing data, primarily focused on human. Consequently, miRMaster, a web-based software solution to analyze hundreds sequencing samples within few hours was implemented. The tool was implemented in a way that it could support different sequencing technologies and library preparation techniques. This flexibility allowed miRMaster to build a consequent user-base, resulting in over 120,000 processed samples and 1,5 billion processed reads, as of July 2021, and therefore laid out the basis for the second goal of this thesis. Indeed, the implementation of a feature allowing users to share their uploaded data contributed strongly to the generation of a detailed annotation of the human small non-coding transcriptome. This annotation was integrated into a new miRNA database, miRCarta, modelling thousands of miRNA candidates and corresponding read expression profiles. A subset of these candidates was then evaluated in the context of different diseases and validated. The thereby gained knowledge was subsequently used to validate additional miRNA candidates and to generate an estimate of the number of miRNAs in human. The large collection of samples, gathered over many years with miRMaster was also integrated into a web server evaluating miRNA arm shifts and switches, miRSwitch. Finally, we published an updated version of miRMaster, expanding its scope to other species and adding additional downstream analysis capabilities. The second goal of this thesis was further pursued by investigating the distribution of miRNAs across different human tissues and body fluids, as well as the variability of miRNA profiles over the four seasons of the year. Furthermore, small non-coding RNAs in zoo animals were examined and a tissue atlas of small non-coding RNAs for mice was generated. The third goal, the assessment of technological advances, was addressed by evaluating the new combinatorial probe-anchor synthesis-based sequencing technology published by BGI, analyzing the effect of RNA integrity on sequencing data, analyzing low-input library preparation protocols, and comparing template-switch based library preparation protocols to ligation-based ones. In addition, an antibody-based labeling sequencing chemistry, CoolMPS, was investigated. Deriving an understanding of the orchestrated regulation by miRNAs, the fourth goal of this thesis, was pursued in a first step by the implementation of a web server visualizing miRNA-gene interaction networks, miRTargetLink. Subsequently, miRPathDB, a database incorporating pathways affected by miRNAs and their targets was implemented, as well as miEAA 2.0, a web server offering quick miRNA set enrichment analyses in over 130,000 categories spanning 10 different species. In addition, miRSNPdb, a database evaluating the effects of single nucleotide polymorphisms and variants in miRNAs or in their target genes was created. Finally, the fifth goal of the thesis, the evaluation of the suitability of miRNAs as biomarkers for human diseases was tackled by investigating the expression profiles of miRNAs with machine learning. An Alzheimer's disease cohort with over 400 individuals was analyzed, as well as another neurodegenerative disease cohort with multiple time points of Parkinson's disease patients and healthy controls. Furthermore, a lung cancer cohort covering 3,000 individuals was examined to evaluate the suitability of an early detection test. In addition, we evaluated the expression profile changes induced by aging on a cohort of 1,334 healthy individuals and over 3,000 diseased patients. Altogether, the herein described tools, databases and research papers present valuable advances and insights into the miRNA research field and have been used and cited by the research community over 2,000 times as of July 2021.Während insbesondere die frühe Genetik-Forschung sich auf den kleinen Teil des menschlichen Genoms konzentrierte, der für Proteine kodiert, wurde deutlich, dass auch in den übrigen Regionen Moleküle kodiert werden, die für viele wichtige Funktionen verantwortlich sind. Ursprünglich ging man davon aus, dass nicht codierende RNAs, d. h. Moleküle, die nicht in Proteine übersetzt werden, nur aus zwei Klassen bestehen (ribosomale RNAs und Transfer-RNAs). Seit den frühen 1980er Jahren wurden jedoch viele andere nicht-kodierende RNA-Klassen entdeckt. In den letzten zwei Jahrzehnten sind kleine nichtcodierende RNAs (sncRNAs) und insbesondere microRNAs (miRNAs) zu wichtigen Molekülen in der biologischen und biomedizinischen Forschung geworden. In dieser Arbeit werden fünf Aspekte der miRNA-Forschung behandelt. Ausgehend von der Entwicklung fortschrittlicher Computersoftware zur Analyse von miRNA-Daten (1) wurde ein tiefgreifendes Verständnis menschlicher und nicht-menschlicher miRNAs entwickelt und Datenbanken mit diesem Wissen erstellt (2). Darüber hinaus wurden die Auswirkungen des technologischen Fortschritts bewertet (3). Wir haben auch dazu beigetragen, zu verstehen, wie miRNAs koordiniert agieren, um menschliche Gene zu regulieren (4). Schließlich bewerteten wir anhand der Erkenntnisse, die wir mit den Tools und Ressourcen der genannten Aspekte gewonnen hatten, die Eignung von miRNAs als Biomarker (5). Mit der Etablierung der Sequenzierung der nächsten Generation war das primäre Ziel dieser Arbeit die Schaffung einer fortschrittlichen bioinformatischen Analysepipeline für Hochdurchsatz-MiRNA-Sequenzierungsdaten, die sich in erster Linie auf den Menschen konzentriert. Daher wurde miRMaster, eine webbasierte Softwarelösung zur Analyse von Hunderten von Sequenzierproben innerhalb weniger Stunden, implementiert. Das Tool wurde so implementiert, dass es verschiedene Sequenzierungstechnologien und Bibliotheksvorbereitungstechniken unterstützen kann. Diese Flexibilität ermöglichte es miRMaster, eine konsequente Nutzerbasis aufzubauen, die im Juli 2021 über 120.000 verarbeitete Proben und 1,5 Milliarden verarbeitete Reads umfasste, womit die Grundlage für das zweite Ziel dieser Arbeit geschaffen wurde. Die Implementierung einer Funktion, die es den Nutzern ermöglicht, ihre hochgeladenen Daten mit anderen zu teilen, trug wesentlich zur Erstellung einer detaillierten Annotation des menschlichen kleinen nicht-kodierenden Transkriptoms bei. Diese Annotation wurde in eine neue miRNA-Datenbank, miRCarta, integriert, die Tausende von miRNA-Kandidaten und entsprechende Expressionsprofile abbildet. Eine Teilmenge dieser Kandidaten wurde dann im Zusammenhang mit verschiedenen Krankheiten bewertet und validiert. Die so gewonnenen Erkenntnisse wurden anschließend genutzt, um weitere miRNA-Kandidaten zu validieren und eine Schätzung der Anzahl der miRNAs im Menschen vorzunehmen. Die große Sammlung von Proben, die über viele Jahre mit miRMaster gesammelt wurde, wurde auch in einen Webserver integriert, der miRNA-Armverschiebungen und -Wechsel auswertet, miRSwitch. Schließlich haben wir eine aktualisierte Version von miRMaster veröffentlicht, die den Anwendungsbereich auf andere Spezies ausweitet und zusätzliche Downstream-Analysefunktionen hinzufügt. Das zweite Ziel dieser Arbeit wurde weiterverfolgt, indem die Verteilung von miRNAs in verschiedenen menschlichen Geweben und Körperflüssigkeiten sowie die Variabilität der miRNA-Profile über die vier Jahreszeiten hinweg untersucht wurde. Darüber hinaus wurden kleine nichtkodierende RNAs in Zootieren untersucht und ein Gewebeatlas der kleinen nichtkodierenden RNAs für Mäuse erstellt. Das dritte Ziel, die Einschätzung des technologischen Fortschritts, wurde angegangen, indem die neue kombinatorische Sonden-Anker-Synthese-basierte Sequenzierungstechnologie, die vom BGI veröffentlicht wurde, bewertet wurde, die Auswirkungen der RNA-Integrität auf die Sequenzierungsdaten analysiert wurden, Protokolle für die Bibliotheksvorbereitung mit geringem Input analysiert wurden und Protokolle für die Bibliotheksvorbereitung auf der Basis von Template-Switch mit solchen auf Ligationsbasis verglichen wurden. Darüber hinaus wurde eine auf Antikörpern basierende Labeling-Sequenzierungschemie, CoolMPS, untersucht. Das vierte Ziel dieser Arbeit, das Verständnis der orchestrierten Regulation durch miRNAs, wurde in einem ersten Schritt durch die Implementierung eines Webservers zur Visualisierung von miRNA-Gen-Interaktionsnetzwerken, miRTargetLink, verfolgt. Anschließend wurde miRPathDB implementiert, eine Datenbank, die von miRNAs und ihren Zielgenen beeinflusste Pfade enthält, sowie miEAA 2.0, ein Webserver, der schnelle miRNA-Anreicherungsanalysen in über 130.000 Kategorien aus 10 verschiedenen Spezies bietet. Darüber hinaus wurde miRSNPdb, eine Datenbank zur Bewertung der Auswirkungen von Einzelnukleotid-Polymorphismen und Varianten in miRNAs oder ihren Zielgenen, erstellt. Schließlich wurde das fünfte Ziel der Arbeit, die Bewertung der Eignung von miRNAs als Biomarker für menschliche Krankheiten, durch die Untersuchung der Expressionsprofile von miRNAs anhand von maschinellem Lernen angegangen. Eine Alzheimer-Kohorte mit über 400 Personen wurde analysiert, ebenso wie eine weitere neurodegenerative Krankheitskohorte mit Parkinson-Patienten an mehreren Zeitpunkten der Krankheit und gesunden Kontrollen. Außerdem wurde eine Lungenkrebskohorte mit 3.000 Personen untersucht, um die Eignung eines Früherkennungstests zu bewerten. Darüber hinaus haben wir die altersbedingten Veränderungen des Expressionsprofils bei einer Kohorte von 1.334 gesunden Personen und über 3.000 kranken Patienten untersucht. Insgesamt stellen die hier beschriebenen Tools, Datenbanken und Forschungsarbeiten wertvolle Fortschritte und Erkenntnisse auf dem Gebiet der miRNA-Forschung dar und wurden bis Juli 2021 von der Forschungsgemeinschaft über 2.000 Mal verwendet und zitiert

    Algorithms and Applications for non-coding RNAs in Aging

    Get PDF
    Gene expression is a complex molecular process governing fate and function of most eukaryotic cells. The fundamental mechanism, namely that genetic material of a cell is compactly stored on chromosomal DNA and at times being transcribed into messenger-RNA to facilitate on-demand protein biosynthesis, is widely known. However, the interplay of biochemical regulatory pathways underlying an individual’s disease phenotype development remains incompletely understood. Intriguingly, the ∼ 20.000 protein-coding genes only account for 2% of the human genome, triggering profound questions on the purpose of remaining segments. In recent years it became apparent that non-coding RNAs essentially tune the observed gene expression circuits. In particular the small non-coding RNAs such as microRNAs, turned out to be regulatory players by switching on and off protein translation of target messenger-RNAs. Several thousand mammalian microRNAs have been discovered so far but little is known about their impact on the transcriptome, which likely depends on contextual variables like cell type identity, cellular and tissue environment or phase of activation. Previous efforts demonstrated that gene expression programs in human and mouse undergo gradual changes along the life trajectory with amplification at higher ages. In parallel, age-related diseases are currently accumulating in our globally aging population, posing a serious challenge to our society and healthcare systems. Neurodegenerative disorders such as Alzheimer’s disease and Parkinson’s disease show steadily rising incidence rates with several million people already affected. Both are caused by pathological protein accumulation in selectively vulnerable neurons and brain regions. Notably, these neurological disorders do not appear all of a sudden in an individual but are believed to originate after long asymptomatic phases of subtle aberrant changes on the cellular level, turning early diagnosis into an intricate affair. Yet, no single comprehensive model to explain aging associated changes in gene expression exists and certainly any such model must take into account the role of microRNAs and other important non-coding RNAs. With the advent of ultra-high-throughput sequencing techniques and unprecedented computational power, the screening of microRNAs and their targets from human biofluids and tissues became not only affordable but scalable. To deal with the increasing complexity of molecular studies, novel bioinformatics-driven approaches are needed to generate reproducible and comprehensive conclusions from large-scale data sets. Here, the role of small non-coding RNAs in governing gene expression changes observed in complex age-related diseases is explored with the aid of new methods and databases as well as several thousand RNA profiling samples. This cumulative doctoral thesis comprises eight peer-reviewed publications. Basic research covers a comprehensive review on most target prediction tools and a novel experimental and computational workflow for microRNA-target pathway identification. In addition, with miRPathDB 2.0 the so-far largest database on enriched microRNA pathways for human and mouse is presented. Moreover, the new versatile web tool miEAA 2.0 allows rapid annotation of statistically enriched molecular properties and functions for large lists of microRNAs from ten species. The lessons learned from web-based tool development were condensed in an invited summary and survey article on scientific web server availability along with best practices for developers. The here presented toolkit was used in three applied research studies to investigate the association between microRNAs and their target pathways in the context of aging as well as the to date largest Parkinson’s disease biomarker discovery framework. Circulating microRNAs obtained low-invasively from whole-blood samples bear diagnostic and prognostic value in Alzheimer’s and Parkinson’s disease patients, which was discovered using machine learning models. Furthermore, selected microRNA families were found to systematically target entire signaling pathways as to effectively silence gene expression. Indeed, these pathways are affected in prevalent neurodegenerative disorders. Taken together, the published candidate signatures and validated targets are pivotal for subsequent experimental perturbation in microRNA or gene knockout studies. In future efforts, large-scale single-cell studies will be required to further dissect disease and cell-type specificity of aging disease biomarker candidates and their long-term effect on gene expression, possibly indicating early neuropathological hallmarks.Genexpression ist ein komplexer molekularer Prozess, der das Überleben und die Funktion der meisten eukaryotischen Zellen entscheidend beeinflusst. Der zugrunde liegende Mechanismus, nämlich, dass das genetische Material einer Zelle kompakt in chromosomaler DNA vorliegt und je nach Bedarf in messenger-RNA zur Proteinbiosynthese genutzt wird, ist weitgehend bekannt. Allerdings ist das Zusammenspiel der regulatorischen Pfade im Hintergrund der phenotypischen Veränderungen von erkrankten Individuen nur wenig verstanden. Interessanterweise machen die fast 20.000 protein-kodierenden Gene nur in etwa 2% des menschlichen Erbgutes aus. In den letzten Jahren hat man festgestellt, dass nicht-kodierende RNAs eine essentielle Rolle bei der Einstellung der beobachteten Genexpressionsschaltkreise spielen. Insbesondere kleine nicht-kodierende RNAs wie microRNAs, stellten sich als zuvor unterschätzte regulatorische Einheiten heraus, die die Translation von Ziel-messenger-RNA in Proteine an und ausschalten. Mehrere tausend microRNAs wurden bisher bei Säugetieren entdeckt, trotzdem ist immer noch wenig über ihren Einfluss auf das Transkriptom bekannt, ein Zusammenhang der wahrscheinlich vom Kontext wie Zelltypidentität, dem zelluären Umfeld sowie dem umgebenden Gewebe, und den Aktivierungsphasen abhängt. Frühere Forschungsarbeiten haben bereits gezeigt, dass das Genexpressionsprogramm im Menschen und in der Maus sukzessiven Änderungen im Laufe des Lebens unterworfen ist, welche sich im höheren Alter verstärken. Zur gleichen Zeit akkumulieren Fälle von altersbedingten Krankheiten in unserer immer älter werdenden, globalen Population, was ernstzunehmende Herausforderungen für unsere Gesellschaft sowie unser Gesundheitssystem mit sich bringt. Neurodegenerative Krankheiten wie Morbus Alzheimer und Morbus Parkinson zeigen eine kontinuierlich ansteigende Inzidenz, wobei bereits mehrere millionen Menschen weltweit betroffen sind. Besonders für diese Krankheiten ist, dass sie bei einem Menschen nicht spontan oder plötzlich entstehen, sondern vermutlich nach langer Zeit der asymptomatischen Phase aufgrund schleichender, abnormaler Veränderungen auf zellulärer Ebene entstehen, was eine frühe Diagnose überaus schwierig gestaltet. Bisher existiert noch kein verständliches Modell das die altersassoziierten Veränderungen der Genexpression erklären kann, wobei jedes darauf ausgerichtete Modell mit Bestimmtheit die Rolle der microRNAs und anderen wichtigen nicht-kodierenden RNAs zwangsläufig in Betracht ziehen muss. Mit dem Aufkommen der Sequenzierung im Ultrahochdurchsatzverfahren und der unübertroffenen Leistung moderner Computersysteme, wurde die Untersuchung von microRNAs und ihren Zielgenen anhand von Proben menschlicher Flüssigkeiten und Geweben nicht nur möglich gemacht, sondern kann entsprechend hochskaliert werden. Um mit der zunehmenden Komplexität molekularer Studien Schritt zu halten, braucht es neue Ansätze der Bioinformatik um reproduzierbare und nachvollziehbare Schlüsse aus großen Datensätzen gewinnen zu können. Im Rahmen dieser Arbeit wurden kleine nicht-kodierende RNAs hinsichtlich ihrer Rolle der Genregulation in komplexen altersbedingten Krankheiten anhand neuer Methoden und Datenbanken sowie mehreren tausend Proben der RNA-Sequenzierung untersucht. Diese kumulative Dissertationsarbeit umfasst acht von unabhängigen Experten begutachtete (peer-reviewed), wissenschaftliche Publikationen. Die Grundlagenforschung enthält einen umfassenden Übersichtsartikel zu fast allen Methoden der Vorhersage von microRNA Zielgenen sowie ein neuartiges Protokoll bestehend aus Labormethoden und computergestützen Berechnungen zur Identifikation von durch microRNAs regulierte Genpfade. Zusätzlich wird mit miRPathDB 2.0 die bisher größte Datenbank zu signifikant angereicherten microRNA Zielpfaden präsentiert. Des Weiteren, bietet die neue und vielseitige, web-basierte Software miEAA 2.0 die Möglichkeit der rasanten Annotation statistisch angereicherter, molekularer Eigenschaften sowie bekannter Funktionen einer gegebenen Liste an microRNAs von zehn Spezies. Die durch web-basierte Softwareentwicklung zuvor angelernten Fähigkeiten sowie daraus resultierende Empfehlungen für nachfolgende Entwickler wurden kurz und bündig in einem eingeladenen Übersichtsartikel zum Thema Verfügbarkeit wissenschaftlicher Software im Internet veröffentlicht. Die hier präsentierten Werkzeuge wurden gezielt in drei Studien zur angewandten Forschung genutzt um die Assoziation zwischen microRNAs und ihren Zielpfaden im Kontext der allgemeinen Altersforschung sowie im Rahmen der bisher größten Studie zur Entdeckung von Biomarkern der Parkinson Krankheit zu untersuchen. Im Blutkreislauf zirkulierende microRNAs, die anhand von Vollblutproben extrahiert wurden, zeigen diagnostisches und prognostisches Potential bei Alzheimer und Parkinson Patienten, was mit Methoden des maschinellen Lernens entdeckt werden konnte. Überdies konnte herausgefunden werden, dass bestimmte microRNA Familien systematisch Signalwege blockieren können, um die Genexpression herunterzufahren. Tatsächlich sind diese Pfade auch in neurodegenerativen Krankheiten betroffen. Insgesamt sind die hier publizierten Signaturen von Kandidaten-microRNAs und einiger validierter Zielgene herausragend dazu geeignet in weiteren Studien anhand von gezielter Ausschaltung im Labor genauer untersucht zu werden. In zukünftigen Forschungsprojekten sollten groß angelegte Untersuchungen vieler einzelner Zellen im Vordergrund stehen, um zu verstehen wie spezifisch für Krankheit oder Zelltyp die hier genannten Biomarker-Kandidaten für altersbedingte Krankheiten sind. Auch wird es wichtig sein die Langzeiteffekte von dysregulierten microRNAs auf die Genexpression zu verstehen, die möglicherweise frühzeitig neuropathologische Kennzeichen widerspiegeln
    corecore