30 research outputs found

    An Integration-Oriented Ontology to Govern Evolution in Big Data Ecosystems

    Full text link
    Big Data architectures allow to flexibly store and process heterogeneous data, from multiple sources, in their original format. The structure of those data, commonly supplied by means of REST APIs, is continuously evolving. Thus data analysts need to adapt their analytical processes after each API release. This gets more challenging when performing an integrated or historical analysis. To cope with such complexity, in this paper, we present the Big Data Integration ontology, the core construct to govern the data integration process under schema evolution by systematically annotating it with information regarding the schema of the sources. We present a query rewriting algorithm that, using the annotated ontology, converts queries posed over the ontology to queries over the sources. To cope with syntactic evolution in the sources, we present an algorithm that semi-automatically adapts the ontology upon new releases. This guarantees ontology-mediated queries to correctly retrieve data from the most recent schema version as well as correctness in historical queries. A functional and performance evaluation on real-world APIs is performed to validate our approach.Comment: Preprint submitted to Information Systems. 35 page

    High-throughput sequencing contribution in bioinformatics analysis of hepatitis C virus genome

    No full text
    Le séquençage haut débit a été utilisé dans ce travail pour reconstruire avec des méthodes adaptées le génomeviral entier du virus de l’hépatite C (VHC) notamment pour le typer avec précision. Une étude a ainsi permisde mettre en évidence la présence d’une forme recombinante du VHC chez un patient. Une autre a permisde typer et détecter les mutations de résistance de plusieurs souches de VHC de génotypes différents. Enfin,une dernière étude basée sur cette approche a permis de découvrir une souche VHC appartenant à un nouveausous-type. Le séquençage haut débit a aussi été utilisé dans ce travail pour détecter des infections multiples etanalyser l’évolution virale en ciblant des gènes du VHC et en mettant en œuvre des méthodes non spécifiquespour 2 patients VHC sous traitement. Cette étude rétrospective a permis de définir la composition de chaqueéchantillon temporel, estimer leur diversité nucléotidique, explorer la structure génétique de la population viraleet son évolution temporelle et dater les infections secondaires. Les résultats obtenus supportent l’hypothèse d’unmécanisme d’apparition de résistance au traitement (selective sweeps).High-throughput sequencing has been used in this work to reconstruct with adapted methods the whole genomeof the hepatitis C virus (HCV) particularly for accurately typing the virus. Thus, we managed to detect in a studya recombinant form of HCV circulating within a patient. We typed and detected in another study resistancemutations of several HCV strains of different genotypes. Finally, a last study based on this approach enabled touncover a HCV strain belonging to a new subtype. High-throughput sequencing has also been used in this workto detect multiple infections and analyze viral evolution with targeted HCV genes and non-specific methods for2 HCV patients under treatment. This retrospective study enabled to define the composition of each temporalsample, assess their nucleotide diversity, investigate viral population genetic structure and temporal evolutionand date secondary infections. Results of this analysis support the hypothesis of onset mechanism of treatmentresistance (selective sweeps)

    Apport du séquençage haut débit dans l'analyse bioinformatique du génome du virus de l'hépatite C

    No full text
    High-throughput sequencing has been used in this work to reconstruct with adapted methods the whole genomeof the hepatitis C virus (HCV) particularly for accurately typing the virus. Thus, we managed to detect in a studya recombinant form of HCV circulating within a patient. We typed and detected in another study resistancemutations of several HCV strains of different genotypes. Finally, a last study based on this approach enabled touncover a HCV strain belonging to a new subtype. High-throughput sequencing has also been used in this workto detect multiple infections and analyze viral evolution with targeted HCV genes and non-specific methods for2 HCV patients under treatment. This retrospective study enabled to define the composition of each temporalsample, assess their nucleotide diversity, investigate viral population genetic structure and temporal evolutionand date secondary infections. Results of this analysis support the hypothesis of onset mechanism of treatmentresistance (selective sweeps).Le séquençage haut débit a été utilisé dans ce travail pour reconstruire avec des méthodes adaptées le génomeviral entier du virus de l’hépatite C (VHC) notamment pour le typer avec précision. Une étude a ainsi permisde mettre en évidence la présence d’une forme recombinante du VHC chez un patient. Une autre a permisde typer et détecter les mutations de résistance de plusieurs souches de VHC de génotypes différents. Enfin,une dernière étude basée sur cette approche a permis de découvrir une souche VHC appartenant à un nouveausous-type. Le séquençage haut débit a aussi été utilisé dans ce travail pour détecter des infections multiples etanalyser l’évolution virale en ciblant des gènes du VHC et en mettant en œuvre des méthodes non spécifiquespour 2 patients VHC sous traitement. Cette étude rétrospective a permis de définir la composition de chaqueéchantillon temporel, estimer leur diversité nucléotidique, explorer la structure génétique de la population viraleet son évolution temporelle et dater les infections secondaires. Les résultats obtenus supportent l’hypothèse d’unmécanisme d’apparition de résistance au traitement (selective sweeps)

    Apport du séquençage haut débit dans l'analyse bioinformatique du génome du virus de l'hépatite C

    Get PDF
    High-throughput sequencing has been used in this work to reconstruct with adapted methods the whole genomeof the hepatitis C virus (HCV) particularly for accurately typing the virus. Thus, we managed to detect in a studya recombinant form of HCV circulating within a patient. We typed and detected in another study resistancemutations of several HCV strains of different genotypes. Finally, a last study based on this approach enabled touncover a HCV strain belonging to a new subtype. High-throughput sequencing has also been used in this workto detect multiple infections and analyze viral evolution with targeted HCV genes and non-specific methods for2 HCV patients under treatment. This retrospective study enabled to define the composition of each temporalsample, assess their nucleotide diversity, investigate viral population genetic structure and temporal evolutionand date secondary infections. Results of this analysis support the hypothesis of onset mechanism of treatmentresistance (selective sweeps).Le séquençage haut débit a été utilisé dans ce travail pour reconstruire avec des méthodes adaptées le génomeviral entier du virus de l’hépatite C (VHC) notamment pour le typer avec précision. Une étude a ainsi permisde mettre en évidence la présence d’une forme recombinante du VHC chez un patient. Une autre a permisde typer et détecter les mutations de résistance de plusieurs souches de VHC de génotypes différents. Enfin,une dernière étude basée sur cette approche a permis de découvrir une souche VHC appartenant à un nouveausous-type. Le séquençage haut débit a aussi été utilisé dans ce travail pour détecter des infections multiples etanalyser l’évolution virale en ciblant des gènes du VHC et en mettant en œuvre des méthodes non spécifiquespour 2 patients VHC sous traitement. Cette étude rétrospective a permis de définir la composition de chaqueéchantillon temporel, estimer leur diversité nucléotidique, explorer la structure génétique de la population viraleet son évolution temporelle et dater les infections secondaires. Les résultats obtenus supportent l’hypothèse d’unmécanisme d’apparition de résistance au traitement (selective sweeps)

    Dynamique de l’évolution intra-patient du VHC par NGS

    No full text
    High throughput sequencing of rapidly evolving hepatitis C virus populations enables large-scale studies of within-host viral heterogeneity and resistance to antiviral treatment regimes that are commonly observed in clinical cases with chronic infections. While escape from direct antiviral drugs can be explained by resistance mutations in targeted genomic regions, the absence of response to dual therapies has remained less understood. In this study we implemented amplicon sequencing to survey genomic variation at the Core and NS5B regions of HCV over a period of 13 years for two patients followed for chronic hepatitis C at Grenoble-Alpes University Hospital. From samples obtained at several time points, we observed mixed infection by multiple HCV genotypes in patients. Genetic heterogeneity and sample composition analysis provided information about the changes in viral population over the course of clinical treatment, with NS5B experiencing a sharp increase in diversity after treatment initiation compared to baseline. Evidence for HCV population genetic structure was observed in each patient, occurring in divergent lineages in phylogenetic trees. These observations point towards diversifying selection occurring post-treatment, acting on standing genomic variation and maintaining high genetic heterogeneity during infection. Being associated with treatment efficiency, the results provide the first evidence for antiviral treatment inducing soft selective sweeps in chronically infected patients with multiple HCV genotypes.Le séquençage haut débit des populations à évolution rapide du virus de l’hépatite C (VHC) permet des études à grande échelle de l’hétérogénéité virale intra-hôte et de la résistance aux traitements anti-viraux communément observée en infection chronique. Alors que l’échappement au traitement anti-viral direct peut être expliqué par des mutations de résistance dans des régions génomiques ciblées, l’absence de réponse à la bithérapie (interféron pegylé et ribavirine) reste moins comprise. Dans cette étude, nous avons réalisé un séquençage par amplicon pour étudier la variation génomique des régions Core et NS5B du VHC sur une période de 13 ans pour deux patients suivis pour hépatite C chronique. A partir d’échantillons obtenus à différentes dates, nous avons observé chez ces patients des infections composées de plusieurs génotypes du VHC. L’hétérogénéité génétique et l’analyse de la composition des échantillons a fourni des informations sur les changements dans la population virale au cours du traitement, avec NS5B qui a connu une forte augmentation de diversité après l’initiation du traitement. Des données supportant une structure génétique de population du VHC ont été observées chez tous les patients. Ces observations orientent vers une sélection diversifiante se produisant après traitement, agissant à variation génomique constante et maintenant une grande hétérogénéité génétique durant l’infection. Associés à l’efficacité du traitement, ces résultats fournissent la première preuve à l’occasion d’un traitement anti-viral d’induction de «réduction de variation sélective douce» («soft selective sweeps») chez des patients infectés chroniques avec plusieurs génotypes du VHC

    PREDIMED: Clinical Data Warehouse of Grenoble Alpes University Hospital

    No full text
    International audienceGrenoble Alpes University Hospital (CHUGA) currently deploys a clinical data warehouse PREDIMED to integrate and analyze for research, education and institutional management the data of patients treated at CHUGA. In this poster, we present the methodology used to implement PREDIMED and illustrate its functionality through three first research use cases

    Hepatitis C virus whole genome sequencing: Current methods/issues and future challenges

    No full text
    International audienceTherapy for hepatitis C is currently undergoing a revolution. The arrival of new antiviral agents targeting viral proteins reinforces the need for a better knowledge of the viral strains infecting each patient. Hepatitis C virus (HCV) whole genome sequencing provides essential information for precise typing, study of the viral natural history or identification of resistance-associated variants. First performed with Sanger sequencing, the arrival of next-generation sequencing (NGS) has simplified the technical process and provided more detailed data on the nature and evolution of viral quasi-species. We will review the different techniques used for HCV complete genome sequencing and their applications, both before and after the apparition of NGS. The progress brought by new and future technologies will also be discussed, as well as the remaining difficulties, largely due to the genomic variability

    Patient 1 HCV alignments

    No full text
    16 HCV sequence alignments for patient 1 - Core and NS5B regions, 8 time samples

    Patient 3 HCV alignments

    No full text
    6 HCV sequence alignments for patient 3 - Core and NS5B regions, 3 time sample

    Patient 2 HVC alignments

    No full text
    10 HCV sequence alignments for patient 2 - Core and NS5B regions, 5 time samples
    corecore