Von Tn5-basierter DNS-Fragmentierungseffizienz und Beurteilung des 'tagmentation site indexing'-Ansatzes für die kontiguität-bewahrende Sequenzierung

Abstract

ACKNOWLEDGMENTS 6 ABBREVIATIONS 7 SUMMARY 8 Zusammenfassung 9 INTRODUCTION 10 Sequencing gaps: loss of contiguity information 10 Solutions for contiguity preserving sequencing 13 Extending the read length: single molecule sequencing 13 Experimental approaches to link short reads 16 Subselection of a particular part of a genome 16 Random subselection of a part of a genome 20 Cloning pools 20 Fragment pools 22 CPT-seq 24 Proximity ligation strategies 27 Paired indexing of fragmentation sites 29 MATERIALS AND METHODS 34 Materials 34 Chemicals 34 Hardware and Plastic 36 Enzymes 38 Kits 39 Oligonucleotides 39 Plasmids 43 Solutions 43 Methods 45 Tn5 Production 45 Bacterial Stab 45 Glycerol Stocks 45 Plasmid DNA Preparation 45 Sequencing 46 Protein expression 46 Transformation T7 Express lysY/Iq Competent E. coli cells 46 Overexpression 46 Tn5 purification 47 Preparation of Chitin Magnetic Beads 47 Binding 47 Cleavage 48 Elution 48 Protein concentration and buffer exchange 49 Transposase activity assay 49 Fragmentation Efficiency Assay (FEA) 50 Transposon 50 Transposome assembly 50 Tagmentation template 51 Tagmentation 51 qPCR 52 Visual fragments size analysis 52 PITS Library Preparation 53 Transposome assembly 53 Phage Lambda genomic DNA 53 Tagmentation 53 Dilution 54 Oligo replacement and gap-filling reaction 54 Amplification 55 Flow cell loading and sequencing 56 Sequencing analysis 56 Preparation of Alternative Transposon structures 57 Synthetic Lampion Transposon 57 Preparation of PCR Products of Different Lengths 57 Transposon Insertion with Epicentre Transposase 58 Transposon Insertion with In-House Tn5 Transposase 59 RESULTS AND DISCUSSION 60 Preface 60 Tagmentation sites indexing approach for contiguity-preserving sequencing 60 NGS library preparation from amol amounts of DNA and non-residual loading on Illumina sequencing flowcell 61 Tagmentation 63 Dilution of the tagmentation reaction 64 Gap repair reaction 65 Amplification and loading on a flowcell 67 Recommended experimental setup 68 Proof-of principle paired indexing experiment 71 Indexing scheme 71 Template selection 73 PITS libraries sequencing 73 Preparation of in-house Tn5 Transposase 78 Tn5 Transposase expression and purification 78 Transposase activity assay 79 Fragmentation efficiency assay (FEA) 79 Discussion of the PITS protocol 86 REFERENCES 89 SUPPLEMENTARY 100A novel contiguity-preserving sequencing approach was developed and tested – paired indexing at tagmentation sites (PITS). The idea of the method is to use paired indices to individually label pairs of DNA molecule ends originating at tagmentation sites. Indices from the same pair on the ends of two sequencing library fragments would mean that those fragments were next to each other in the original molecule. Thus after getting separated in the way it occurs in a standard sequencing library preparation protocol library, fragments after sequencing would be assembled again and the contiguity of the sequence would be restored. Convenient system for testing of the PITS method was chosen and proof-of-principle experiment was performed. Though few, scaffolds containing up to 4 subsequent library molecules were assembled. Some of the constraints of the PITS approach were revealed and optimization possibilities for future work were determined. A patent application describing the PITS protocol is in preparation. During the course of this PhD, an efficient method for preparation of sequencing library from amol amounts of tagmentation products has been established – post tagmentation ultra low input (PTULI) protocol. The method aims at preserving possibly all tagmentation fragments throughout sequencing library preparation process. The developed protocol provides detailed instructions on the controls setup and guidelines for subsequent non- residual loading of the PTULI library on a sequencer. The PTULI library preparation strategy is suitable for PITS, and is also of value for other minute input material sequencing applications. To make contiguity-preserving sequencing work possible, in-house Tn5 transposase was prepared. Applications of this enzyme within the settings other than those in commercially available kits are hardly known and further development of the PITS approach to a great extent depends on the potential of this enzyme. That is why in parallel to the PITS method itself, Tn5 properties were studied. An electrophoresis free assay for characterizing Tn5 transposomes fragmentation efficiency was developed and published [Rykalina et al., 2017]. This assay is a convenient monitoring system for the setup of tagmentation protocols and for optimization experiments.Es wurde ein neuartiger Kontiguität-bewahrender Sequenzierungsansatz entwickelt und getestet: gepaarte Indizierung an Tagmentationsstellen (Paired Indexing at Tagmentation Sites - PITS). Die Idee der Methode besteht darin, die Paare der DNA-Molekül-Enden, die ursprünglich von Tagmentationsstellen stammen, individuell mit gepaarten Indizes zu markieren. Gleiche Indizes an den Enden der zwei sequenzierten Bibliotheksfragmente würde bedeuten, dass diese Fragmente im ursprünglichen Molekül nebeneinander angeordnet waren. Dank dieser Methode werden die Fragmente, die während der Herstellung von Sequenzierungsbibliotheken getrennt wurden, wieder zusammengesetzt und damit die Kontiguität der Sequenz der ursprünglichen DNA-Moleküle wiederhergestellt. Es wurde ein praktisches System für die Prüfung der PITS-Methode gewählt und ein proof-of-principle Experiment durchgeführt. DNA Ketten mit bis zu vier nachfolgenden Bibliotheksmolekülen wurden zusammengebaut. Einige der Einschränkungen des PITS-Ansatzes wurden aufgedeckt und Optimierungsmöglichkeiten für zukünftige Arbeiten ermittelt. Eine Patentanmeldung, die das PITS-Protokoll beschreibt, ist in Vorbereitung. Im Rahmen der Arbeit wurde ein effizientes Verfahren zur Herstellung von Sequenzierungsbibliotheken aus amol-Mengen von Tagmentationsprodukten etabliert, das Post-Tagmentation Ultra Low Input (PTULI) Protokoll. Die Methode zielt darauf ab, möglichst alle Tagmentierungsfragmente während des gesamten Prozesses zur Vorbereitung der Sequenzierungsbibliotheken zu bewahren. Das entwickelte Protokoll enthält detaillierte Anweisungen zum Steuerungs-Setup und Richtlinien für die anschließende komplette Beladung der PTULI-Bibliothek auf einem Sequenzer. Die PTULI- Bibliotheksvorbereitungsstrategie eignet sich nicht nur für PITS, sondern auch für andere Sequenzierungsanwendungen mit geringen Input. Um dieses Projekt zu ermöglichen, wurde eine eigene Tn5-Transposase hergestellt. Anwendungen dieses Enzyms in anderen settings als in handelsüblichen Kits sind kaum bekannt und die Weiterentwicklung des PITS-Ansatzes hängt weitgehend von dem Potenzial dieses Enzyms ab. Deshalb wurden parallel zur PITS-Methode selbst Tn5-Eigenschaften untersucht. Ein elektrophoresefreier Assay zur Charakterisierung von Tn5-Transposomen Fragmentierungseffizienz wurde entwickelt und veröffentlicht [Rykalina et al., 2017]. Dieser Assay bietet ein bequemes Monitoring-System für den Aufbau von Tagmentationsprotokollen und für Optimierungsexperimente

    Similar works