104,417 research outputs found
Cross-species Conservation of context-specific networks
Background: Many large data compendia on context-specific high-throughput genomic and regulatory data have been made available by international research consortia such as ENCODE, TCGA, and Epigenomics Roadmap. The use of these resources is impaired by the sheer size of the available big data and big metadata. Many of these context-specific data can be modeled as data derived regulatory networks (DDRNs) representing the complex and complicated interactions between transcription factors and target genes. These DDRNs are useful for the understanding of regulatory mechanisms and helpful for interpreting biomedical data. Results: The Cross-species Conservation framework (CroCo) provides a network-oriented view on the ENCODE regulatory data (CroCo network repository), convenient ways to access and browse networks and metadata, and a method to combine networks across compendia, experimental techniques, and species (CroCo tool suite). DDRNs can be combined with additional information and networks derived from the literature, curated resources, and computational predictions in order to enable detailed exploration and cross checking of regulatory interactions. Applications of the CroCo framework range from simple evidence look-up for user-defined regulatory interactions to the identification of conserved sub-networks in diverse cell-lines, conditions, and even species. Conclusion: CroCo adds an intuitive unifying view on the data from the ENCODE projects via a comprehensive repository of derived context-specific regulatory networks and enables flexible cross-context, cross-species, and cross-compendia comparison via a basis set of analysis tools. The CroCo web-application and Cytoscape plug-in are freely available at: http://services.bio.ifi.lmu.de/croco-web. The web-page links to a detailed system description, a user guide, and tutorial videos presenting common use cases of the CroCo framework
Cross-species network and transcript transfer
Metabolic processes, signal transduction, gene regulation, as well as gene and protein expression are largely controlled by biological networks. High-throughput experiments allow the measurement of a wide range of cellular states and interactions. However, networks are often not known in detail for specific biological systems and conditions. Gene and protein annotations are often transferred from model organisms to the species of interest. Therefore, the question arises whether biological networks can be transferred between species or whether they are specific for individual contexts. In this thesis, the following aspects are investigated: (i) the conservation and (ii) the cross-species transfer of eukaryotic protein-interaction and gene regulatory (transcription factor- target) networks, as well as (iii) the conservation of alternatively spliced variants.
In the simplest case, interactions can be transferred between species, based solely on the sequence similarity of the orthologous genes. However, such a transfer often results either in the transfer of only a few interactions (medium/high sequence similarity threshold) or in the transfer of many speculative interactions (low sequence similarity threshold). Thus, advanced network transfer approaches also consider the annotations of orthologous genes involved in the interaction transfer, as well as features derived from the network structure, in order to enable a reliable interaction transfer, even between phylogenetically very distant species. In this work, such an approach for the transfer of protein interactions is presented (COIN). COIN uses a sophisticated machine-learning model in order to label transferred interactions as either correctly transferred (conserved) or as incorrectly transferred (not conserved).
The comparison and the cross-species transfer of regulatory networks is more difficult than the transfer of protein interaction networks, as a huge fraction of the known regulations is only described in the (not machine-readable) scientific literature. In addition, compared to protein interactions, only a few conserved regulations are known, and regulatory elements appear to be strongly context-specific. In this work, the cross-species analysis of regulatory interaction networks is enabled with software tools and databases for global (ConReg) and thousands of context-specific (CroCo) regulatory interactions that are derived and integrated from the scientific literature, binding site predictions and experimental data.
Genes and their protein products are the main players in biological networks. However, to date, the aspect is neglected that a gene can encode different proteins. These alternative proteins can differ strongly from each other with respect to their molecular structure, function and their role in networks. The identification of conserved and species-specific splice variants and the integration of variants in network models will allow a more complete cross-species transfer and comparison of biological networks. With ISAR we support the cross-species transfer and comparison of alternative variants by introducing a gene-structure aware (i.e. exon-intron structure aware) multiple sequence alignment approach for variants from orthologous and paralogous genes.
The methods presented here and the appropriate databases allow the cross-species transfer of biological networks, the comparison of thousands of context-specific networks, and the cross-species comparison of alternatively spliced variants. Thus, they can be used as a starting point for the understanding of regulatory and signaling mechanisms in many biological systems.In biologischen Systemen werden Stoffwechselprozesse, Signalübertragungen sowie die Regulation von Gen- und Proteinexpression maßgeblich durch biologische Netzwerke gesteuert. Hochdurchsatz-Experimente ermöglichen die Messung einer Vielzahl von zellulären Zuständen und Wechselwirkungen. Allerdings sind für die meisten Systeme und Kontexte biologische Netzwerke nach wie vor unbekannt. Gen- und Proteinannotationen werden häufig von Modellorganismen übernommen. Demnach stellt sich die Frage, ob auch biologische Netzwerke und damit die systemischen Eigenschaften ähnlich sind und übertragen werden können. In dieser Arbeit wird: (i) Die Konservierung und (ii) die artenübergreifende Übertragung von eukaryotischen Protein-Interaktions- und regulatorischen (Transkriptionsfaktor-Zielgen) Netzwerken, sowie (iii) die Konservierung von Spleißvarianten untersucht.
Interaktionen können im einfachsten Fall nur auf Basis der Sequenzähnlichkeit zwischen orthologen Genen übertragen werden. Allerdings führt eine solche Übertragung oft dazu, dass nur sehr wenige Interaktionen übertragen werden können (hoher bis mittlerer Sequenzschwellwert) oder dass ein Großteil der übertragenden Interaktionen sehr spekulativ ist (niedriger Sequenzschwellwert). Verbesserte Methoden berücksichtigen deswegen zusätzlich noch die Annotationen der Orthologen, Eigenschaften der Interaktionspartner sowie die Netzwerkstruktur und können somit auch Interaktionen auf phylogenetisch weit entfernte Arten (zuverlässig) übertragen. In dieser Arbeit wird ein solcher Ansatz für die Übertragung von Protein-Interaktionen vorgestellt (COIN). COIN verwendet Verfahren des maschinellen Lernens, um Interaktionen als richtig (konserviert) oder als falsch übertragend (nicht konserviert) zu klassifizieren.
Der Vergleich und die artenübergreifende Übertragung von regulatorischen Interaktionen ist im Vergleich zu Protein-Interaktionen schwieriger, da ein Großteil der bekannten Regulationen nur in der (nicht maschinenlesbaren) wissenschaftlichen Literatur beschrieben ist. Zudem sind im Vergleich zu Protein-Interaktionen nur wenige konservierte Regulationen bekannt und regulatorische Elemente scheinen stark kontextabhängig zu sein. In dieser Arbeit wird die artenübergreifende Analyse von regulatorischen Netzwerken mit Softwarewerkzeugen und Datenbanken für globale (ConReg) und kontextspezifische (CroCo) regulatorische Interaktionen ermöglicht. Regulationen wurden dafür aus Vorhersagen, experimentellen Daten und aus der wissenschaftlichen Literatur abgeleitet und integriert.
Grundbaustein für viele biologische Netzwerke sind Gene und deren Proteinprodukte. Bisherige Netzwerkmodelle vernachlässigen allerdings meist den Aspekt, dass ein Gen verschiedene Proteine kodieren kann, die sich von der Funktion, der Proteinstruktur und der Rolle in Netzwerken stark voneinander unterscheiden können. Die Identifizierung von konservierten und artspezifischen Proteinprodukten und deren Integration in Netzwerkmodelle würde einen vollständigeren Übertrag und Vergleich von Netzwerken ermöglichen. In dieser Arbeit wird der artenübergreifende Vergleich von Proteinprodukten mit einem multiplen Sequenzalignmentverfahren für alternative Varianten von paralogen und orthologen Genen unterstützt, unter Berücksichtigung der bekannten Exon-Intron-Grenzen (ISAR).
Die in dieser Arbeit vorgestellten Verfahren, Datenbanken und Softwarewerkzeuge ermöglichen die Übertragung von biologischen Netzwerken, den Vergleich von tausenden kontextspezifischen Netzwerken und den artenübergreifenden Vergleich von alternativen Varianten. Sie können damit die Ausgangsbasis für ein Verständnis von Kommunikations- und Regulationsmechanismen in vielen biologischen Systemen bilden
Robust sound event detection in bioacoustic sensor networks
Bioacoustic sensors, sometimes known as autonomous recording units (ARUs),
can record sounds of wildlife over long periods of time in scalable and
minimally invasive ways. Deriving per-species abundance estimates from these
sensors requires detection, classification, and quantification of animal
vocalizations as individual acoustic events. Yet, variability in ambient noise,
both over time and across sensors, hinders the reliability of current automated
systems for sound event detection (SED), such as convolutional neural networks
(CNN) in the time-frequency domain. In this article, we develop, benchmark, and
combine several machine listening techniques to improve the generalizability of
SED models across heterogeneous acoustic environments. As a case study, we
consider the problem of detecting avian flight calls from a ten-hour recording
of nocturnal bird migration, recorded by a network of six ARUs in the presence
of heterogeneous background noise. Starting from a CNN yielding
state-of-the-art accuracy on this task, we introduce two noise adaptation
techniques, respectively integrating short-term (60 milliseconds) and long-term
(30 minutes) context. First, we apply per-channel energy normalization (PCEN)
in the time-frequency domain, which applies short-term automatic gain control
to every subband in the mel-frequency spectrogram. Secondly, we replace the
last dense layer in the network by a context-adaptive neural network (CA-NN)
layer. Combining them yields state-of-the-art results that are unmatched by
artificial data augmentation alone. We release a pre-trained version of our
best performing system under the name of BirdVoxDetect, a ready-to-use detector
of avian flight calls in field recordings.Comment: 32 pages, in English. Submitted to PLOS ONE journal in February 2019;
revised August 2019; published October 201
Recommended from our members
Open Science principles for accelerating trait-based science across the Tree of Life.
Synthesizing trait observations and knowledge across the Tree of Life remains a grand challenge for biodiversity science. Species traits are widely used in ecological and evolutionary science, and new data and methods have proliferated rapidly. Yet accessing and integrating disparate data sources remains a considerable challenge, slowing progress toward a global synthesis to integrate trait data across organisms. Trait science needs a vision for achieving global integration across all organisms. Here, we outline how the adoption of key Open Science principles-open data, open source and open methods-is transforming trait science, increasing transparency, democratizing access and accelerating global synthesis. To enhance widespread adoption of these principles, we introduce the Open Traits Network (OTN), a global, decentralized community welcoming all researchers and institutions pursuing the collaborative goal of standardizing and integrating trait data across organisms. We demonstrate how adherence to Open Science principles is key to the OTN community and outline five activities that can accelerate the synthesis of trait data across the Tree of Life, thereby facilitating rapid advances to address scientific inquiries and environmental issues. Lessons learned along the path to a global synthesis of trait data will provide a framework for addressing similarly complex data science and informatics challenges
Ecological models at fish community and species level to support effective river restoration
RESUMEN
Los peces nativos son indicadores de la salud de los ecosistemas acuáticos, y se han
convertido en un elemento de calidad clave para evaluar el estado ecológico de los ríos. La
comprensión de los factores que afectan a las especies nativas de peces es importante para la
gestión y conservación de los ecosistemas acuáticos. El objetivo general de esta tesis es analizar
las relaciones entre variables biológicas y de hábitat (incluyendo la conectividad) a través de
una variedad de escalas espaciales en los ríos Mediterráneos, con el desarrollo de herramientas
de modelación para apoyar la toma de decisiones en la restauración de ríos.
Esta tesis se compone de cuatro artículos. El primero tiene como objetivos modelar la
relación entre un conjunto de variables ambientales y la riqueza de especies nativas (NFSR), y
evaluar la eficacia de potenciales acciones de restauración para mejorar la NFSR en la cuenca
del río Júcar. Para ello se aplicó un enfoque de modelación de red neuronal artificial (ANN),
utilizando en la fase de entrenamiento el algoritmo Levenberg-Marquardt. Se aplicó el método
de las derivadas parciales para determinar la importancia relativa de las variables ambientales.
Según los resultados, el modelo de ANN combina variables que describen la calidad de ribera,
la calidad del agua y el hábitat físico, y ayudó a identificar los principales factores que
condicionan el patrón de distribución de la NFSR en los ríos Mediterráneos. En la segunda parte
del estudio, el modelo fue utilizado para evaluar la eficacia de dos acciones de restauración en el
río Júcar: la eliminación de dos azudes abandonados, con el consiguiente incremento de la
proporción de corrientes. Estas simulaciones indican que la riqueza aumenta con el incremento
de la longitud libre de barreras artificiales y la proporción del mesohabitat de corriente, y
demostró la utilidad de las ANN como una poderosa herramienta para apoyar la toma de
decisiones en el manejo y restauración ecológica de los ríos Mediterráneos.
El segundo artículo tiene como objetivo determinar la importancia relativa de los dos
principales factores que controlan la reducción de la riqueza de peces (NFSR), es decir, las
interacciones entre las especies acuáticas, variables del hábitat (incluyendo la conectividad
fluvial) y biológicas (incluidas las especies invasoras) en los ríos Júcar, Cabriel y Turia. Con
este fin, tres modelos de ANN fueron analizados: el primero fue construido solamente con
variables biológicas, el segundo se construyó únicamente con variables de hábitat y el tercero
con la combinación de estos dos grupos de variables. Los resultados muestran que las variables
de hábitat son los ¿drivers¿ más importantes para la distribución de NFSR, y demuestran la
importancia ecológica de los modelos desarrollados. Los resultados de este estudio destacan la
necesidad de proponer medidas de mitigación relacionadas con la mejora del hábitat
(incluyendo la variabilidad de caudales en el río) como medida para conservar y restaurar los
ríos Mediterráneos.
El tercer artículo busca comparar la fiabilidad y relevancia ecológica de dos modelos
predictivos de NFSR, basados en redes neuronales artificiales (ANN) y random forests (RF). La
relevancia de las variables seleccionadas por cada modelo se evaluó a partir del conocimiento
ecológico y apoyado por otras investigaciones. Los dos modelos fueron desarrollados utilizando
validación cruzada k-fold y su desempeño fue evaluado a través de tres índices: el coeficiente de determinación (R2
), el error cuadrático medio (MSE) y el coeficiente de determinación ajustado
(R2
adj). Según los resultados, RF obtuvo el mejor desempeño en entrenamiento. Pero, el
procedimiento de validación cruzada reveló que ambas técnicas generaron resultados similares
(R2
= 68% para RF y R2
= 66% para ANN). La comparación de diferentes métodos de machine
learning es muy útil para el análisis crítico de los resultados obtenidos a través de los modelos.
El cuarto artículo tiene como objetivo evaluar la capacidad de las ANN para identificar los
factores que afectan a la densidad y la presencia/ausencia de Luciobarbus guiraonis en la
demarcación hidrográfica del Júcar. Se utilizó una red neuronal artificial multicapa de tipo feedforward (ANN) para representar relaciones no lineales entre descriptores de L. guiraonis con
variables biológicas y de hábitat. El poder predictivo de los modelos se evaluó con base en el
índice Kappa (k), la proporción de casos correctamente clasificados (CCI) y el área bajo la curva
(AUC) característica operativa del receptor (ROC). La presencia/ausencia de L. guiraonis fue
bien predicha por el modelo ANN (CCI = 87%, AUC = 0.85 y k = 0.66). La predicción de la
densidad fue moderada (CCI = 62%, AUC = 0.71 y k = 0.43). Las variables más importantes
que describen la presencia/ausencia fueron: radiación solar, área de drenaje y la proporción de
especies exóticas de peces con un peso relativo del 27.8%, 24.53% y 13.60% respectivamente.
En el modelo de densidad, las variables más importantes fueron el coeficiente de variación de
los caudales medios anuales con una importancia relativa del 50.5% y la proporción de especies
exóticas de peces con el 24.4%. Los modelos proporcionan información importante acerca de la
relación de L. guiraonis con variables bióticas y de hábitat, este nuevo conocimiento podría
utilizarse para apoyar futuros estudios y para contribuir en la toma de decisiones para la
conservación y manejo de especies en los en los ríos Júcar, Cabriel y Turia.Olaya Marín, EJ. (2013). Ecological models at fish community and species level to support effective river restoration [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/28853TESI
- …