1,669 research outputs found

    HaploJuice : accurate haplotype assembly from a pool of sequences with known relative concentrations

    Get PDF
    Pooling techniques, where multiple sub-samples are mixed in a single sample, are widely used to take full advantage of high-throughput DNA sequencing. Recently, Ranjard et al. [1] proposed a pooling strategy without the use of barcodes. Three sub-samples were mixed in different known proportions (i.e. 62.5%, 25% and 12.5%), and a method was developed to use these proportions to reconstruct the three haplotypes effectively. HaploJuice provides an alternative haplotype reconstruction algorithm for Ranjard et al.’s pooling strategy. HaploJuice significantly increases the accuracy by first identifying the empirical proportions of the three mixed sub-samples and then assembling the haplotypes using a dynamic programming approach. HaploJuice was evaluated against five different assembly algorithms, Hmmfreq [1], ShoRAH [2], SAVAGE [3], PredictHaplo [4] and QuRe [5]. Using simulated and real data sets, HaploJuice reconstructed the true sequences with the highest coverage and the lowest error rate. HaploJuice achieves high accuracy in haplotype reconstruction, making Ranjard et al.’s pooling strategy more efficient, feasible, and applicable, with the benefit of reducing the sequencing cost

    Integration over song classification replicates: Song variant analysis in the hihi

    Get PDF
    Human expert analyses are commonly used in bioacoustic studies and can potentially limit the reproducibility of these results. In this paper, a machine learning method is presented to statistically classify avian vocalizations. Automated approaches were applied to isolate bird songs from long field recordings, assess song similarities, and classify songs into distinct variants. Because no positive controls were available to assess the true classification of variants, multiple replicates of automatic classification of song variants were analyzed to investigate clustering uncertainty. The automatic classifications were more similar to the expert classifications than expected by chance. Application of these methods demonstrated the presence of discrete song variants in an island population of the New Zealand hihi (Notiomystis cincta). The geographic patterns of song variation were then revealed by integrating over classification replicates. Because this automated approach considers variation in song variant classification, it reduces potential human bias and facilitates the reproducibility of the results

    Apport des nouvelles générations de séquençage pour accéder à la diversité des communautés microbiennes du sol : nécessité d’un ‘pipeline’ bio-informatique pour les biologistes

    Get PDF
    Communication orale, résuméLa diversité microbienne d’un sol est difficile à caractériser. Ceci s’explique par une accessibilité plus ou moins importante des populations au sein d’une matrice hétérogène et structurée, mais aussi par l’incapacité à résoudre une information constituée de 100 000 à 1 000 000 d’espèces différentes par gramme de sol. Toutefois, récemment, d’importantes avancées en biologie moléculaire ont permis de mieux caractériser la diversité des communautés microbiennes du sol in situ et ce sans a priori. Ainsi, la puissance des nouvelles générations de séquençage comme le pyroséquençage permettent de travailler en haut-débit afin d’obtenir plusieurs dizaines, voire plusieurs centaines de milliers de séquences à partir d’un ADN méta-génomique. De premières études ont déjà été réalisées avec cette technique afin d’aborder la diversité bactérienne des sols. Ces études ont, pour la première fois, permis de quantifier de façon exhaustive la diversité microbienne de sols en termes de richesse spécifique et de démontrer la pertinence, la faisabilité et la robustesse de cette approche. Cette approche est maintenant unanimement reconnue pour sa pertinence et ses potentialités très importantes, et ce afin de déterminer la diversité des microorganismes telluriques. Notre approche consiste en la caractérisation de la diversité taxonomique (bactérienne et fongique) de sols sur des échantillonnages de grande ampleur dans le temps et dans l’espace, avec comme objectifs : (i) de faire un inventaire exhaustif de la diversité microbienne tellurique, (ii) d’évaluer sa distribution spatiale, (iii) de mieux comprendre sa régulation et, (iv) in fine, de pouvoir relier cette diversité en fonctionnement biologique du sol et en services écosystémiques [1-3]. Cependant, l’étude d’un aussi grand nombre d’échantillons va entraîner la production massive de séquences. Ce caractère massif, ainsi que les caractéristiques inhérentes aux séquences obtenues par cette technique requièrent le développement d’outils bioinformatiques adaptés, optimisés et évalués, afin d’analyser rapidement et efficacement ce type de données. Ce nouveau pipeline d’analyse doit tout d’abord être facile d’utilisation et répondre aux attentes des différents utilisateurs, qu’ils soient compétents en bio-informatique, ou novices dans l’analyse de tels jeux de données. Il doit également permettre de gérer un grand nombre de séquences et d’automatiser les grandes étapes d’analyse (prétraitement, filtration, clustérisation, assignation taxonomique, calculs d’indices d’abondance et de diversité, taux de couverture,…). L’ensemble du système devra enfin être transféré sur un serveur de calcul et accessible au travers d’un serveur Web pour être accessible à la collectivité des écologistes microbiens. L’objectif étant de coupler, sur un grand nombre d’échantillons, cette approche avec des mesures d’activités et de faire le lien entre la diversité microbienne et l’aptitude des sols à rendre des services

    Complete mitochondrial genome of the green-lipped mussel, Perna canaliculus (Mollusca: Mytiloidea), from long nanopore sequencing reads

    Get PDF
    We describe here the first complete genome assembly of the New Zealand green-lipped mussel, Perna canaliculus, mitochondrion. The assembly was performed de novo from a mix of long nanopore sequencing reads and short sequencing reads. The genome is 16,005 bp long. Comparison to other Mytiloidea mitochondrial genomes indicates important gene rearrangements in this family

    Usages des bibliothèques

    Get PDF
    Qu\u27est-ce qu\u27une bibliothèque ? Qui sont ces publics, sur place et à distance ? Comment s\u27approprient-ils l\u27espace, les équipements, les documents et les informations qui leur sont utiles ? Quelles sont leurs relations avec les professionnels des bibliothèques ? La question des publics peine encore à devenir une question centrale et cette publication veut contribuer à faire connaître les usagers et non-usagers dans leur variété. Il s\u27agit d\u27identifier leurs caractérisques sociales mais aussi leurs habitudes, leurs manières de se représenter le monde, leur environnement ou leurs attentes. On décompose la réflexion sur les usagers autour de trois thèmes. La fréquentation : combien sont les usagers ? Qui sont-ils ? Comment le deviennent-ils ? En quoi se distinguent-ils des non-usagers ? Les usages : Quels sont-ils ? Comment les repérer ? Comment les comprendre ? Les logiques d\u27usage, notion qui nous semble plus éclairante que celle de besoin d\u27information. Écrit à quatre mains, cet ouvrage conjugue les approches des publics au fil des chapitres alternant apports théoriques et méthodologiques. Chaque chapitre développe ainsi deux points de vue complémentaires, l\u27énoncé des concepts et des enjeux d\u27une part, la présentation des méthodes et des techniques d\u27autre part. Comment mesurer la fréquentation des publics ? Relever et analyser des paroles d\u27usagers ? Administrer, traiter et interpréter des questionnaires d\u27usages et de satisfaction ? Cet ouvrage, illustré par des exercices d\u27application avec corrigés et enrichi d\u27un glossaire, s\u27adresse aux responsables de services documentaires, de bibliothèques mais aussi aux élèves et étudiants ayant reçu comme mission d\u27étudier une question se rattachant à cette thématique, bref à tous ceux qui souhaitent mieux connaître les publics et les non-publics. Claude Poissenot est maître de conférences en sociologie à l\u27IUT Information-Communication de l\u27université de Nancy 2. Sophie Ranjard est directrice associée du cabinet KYNOS (Paris), spécialisé dans les études auprès des publics de bibliothèques, services documentaires, archives et musées

    Reassembling haplotypes in a mixture of pooled amplicons when the relative concentrations are known: A proof-of-concept study on the efficient design of nextgeneration sequencing strategies

    Get PDF
    Next-generation sequencing can be costly and labour intensive. Usually, the sequencing cost per sample is reduced by pooling amplified DNA = amplicons) derived from different individuals on the same sequencing lane. Barcodes unique to each amplicon permit short-read sequences to be assigned appropriately. However, the cost of the library preparation increases with the number of barcodes used. We propose an alternative to barcoding: by using different known proportions of individually-derived amplicons in a pooled sample, each is characterised a priori by an expected depth of coverage. We have developed a Hidden Markov Model that uses these expected proportions to reconstruct the input sequences. We apply this method to pools of mitochondrial DNA amplicons extracted from kangaroo meat, genus Macropus. Our experiments indicate that the sequence coverage can be efficiently used to index the short-reads and that we can reassemble the input haplotypes when secondary factors impacting the coverage are controlled. We therefore demonstrate that, by combining our approach with standard barcoding, the cost of the library preparation is reduced to a third.This research was supported by the Australian Research Council Discovery Project Grant #DP160103474
    • …
    corecore