8 research outputs found

    BESC knowledgebase public portal†

    Get PDF
    The BioEnergy Science Center (BESC) is undertaking large experimental campaigns to understand the biosynthesis and biodegradation of biomass and to develop biofuel solutions. BESC is generating large volumes of diverse data, including genome sequences, omics data and assay results. The purpose of the BESC Knowledgebase is to serve as a centralized repository for experimentally generated data and to provide an integrated, interactive and user-friendly analysis framework. The Portal makes available tools for visualization, integration and analysis of data either produced by BESC or obtained from external resources

    Systems Biology Knowledgebase for a New Era in Biology A Genomics:GTL Report from the May 2008 Workshop

    Full text link

    BER Science Network Requirements

    Full text link

    The Switchgrass Genome: Tools and Strategies

    Full text link
    Switchgrass ( L.) is a perennial grass species receiving significant focus as a potential bioenergy crop. In the last 5 yr the switchgrass research community has produced a genetic linkage map, an expressed sequence tag (EST) database, a set of single nucleotide polymorphism (SNP) markers that are distributed across the 18 linkage groups, 4x sampling of the AP13 genome in 400-bp reads, and bacterial artificial chromosome (BAC) libraries containing over 200,000 clones. These studies have revealed close collinearity of the switchgrass genome with those of sorghum [ (L.) Moench], rice ( L.), and (L.) P. Beauv. Switchgrass researchers have also developed several microarray technologies for gene expression studies. Switchgrass genomic resources will accelerate the ability of plant breeders to enhance productivity, pest resistance, and nutritional quality. Because switchgrass is a relative newcomer to the genomics world, many secrets of the switchgrass genome have yet to be revealed. To continue to efficiently explore basic and applied topics in switchgrass, it will be critical to capture and exploit the knowledge of plant geneticists and breeders on the next logical steps in the development and utilization of genomic resources for this species. To this end, the community has established a switchgrass genomics executive committee and work group ( [verified 28 Oct. 2011])

    Network and multi-scale signal analysis for the integration of large omic datasets: applications in \u3ci\u3ePopulus trichocarpa\u3c/i\u3e

    Get PDF
    Poplar species are promising sources of cellulosic biomass for biofuels because of their fast growth rate, high cellulose content and moderate lignin content. There is an increasing movement on integrating multiple layers of ’omics data in a systems biology approach to understand gene-phenotype relationships and assist in plant breeding programs. This dissertation involves the use of network and signal processing techniques for the combined analysis of these various data types, for the goals of (1) increasing fundamental knowledge of P. trichocarpa and (2) facilitating the generation of hypotheses about target genes and phenotypes of interest. A data integration “Lines of Evidence” method is presented for the identification and prioritization of target genes involved in functions of interest. A new post-GWAS method, Pleiotropy Decomposition, is presented, which extracts pleiotropic relationships between genes and phenotypes from GWAS results, allowing for identification of genes with signatures favorable to genome editing. Continuous wavelet transform signal processing analysis is applied in the characterization of genome distributions of various features (including variant density, gene density, and methylation profiles) in order to identify chromosome structures such as the centromere. This resulted in the approximate centromere locations on all P. trichocarpa chromosomes, which had previously not been adequately reported in the scientific literature. Discrete wavelet transform signal processing followed by correlation analysis was applied to genomic features from various data types including transposable element density, methylation density, SNP density, gene density, centromere position and putative ancestral centromere position. Subsequent correlation analysis of the resulting wavelet coefficients identified scale-specific relationships between these genomic features, and provide insights into the evolution of the genome structure of P. trichocarpa. These methods have provided strategies to both increase fundamental knowledge about the P. trichocarpa system, as well as to identify new target genes related to biofuels targets. We intend that these approaches will ultimately be used in the designing of better plants for more efficient and sustainable production of bioenergy

    Insights from 20 years of bacterial genome sequencing

    Get PDF

    Insights from 20 years of bacterial genome sequencing

    Get PDF
    Since the first two complete bacterial genome sequences were published in 1995, the science of bacteria has dramatically changed. Using third-generation DNA sequencing, it is possible to completely sequence a bacterial genome in a few hours and identify some types of methylation sites along the genome as well. Sequencing of bacterial genome sequences is now a standard procedure, and the information from tens of thousands of bacterial genomes has had a major impact on our views of the bacterial world. In this review, we explore a series of questions to highlight some insights that comparative genomics has produced. To date, there are genome sequences available from 50 different bacterial phyla and 11 different archaeal phyla. However, the distribution is quite skewed towards a few phyla that contain model organisms. But the breadth is continuing to improve, with projects dedicated to filling in less characterized taxonomic groups. The clustered regularly interspaced short palindromic repeats (CRISPR)-Cas system provides bacteria with immunity against viruses, which outnumber bacteria by tenfold. How fast can we go? Second-generation sequencing has produced a large number of draft genomes (close to 90 % of bacterial genomes in GenBank are currently not complete); third-generation sequencing can potentially produce a finished genome in a few hours, and at the same time provide methlylation sites along the entire chromosome. The diversity of bacterial communities is extensive as is evident from the genome sequences available from 50 different bacterial phyla and 11 different archaeal phyla. Genome sequencing can help in classifying an organism, and in the case where multiple genomes of the same species are available, it is possible to calculate the pan- and core genomes; comparison of more than 2000 Escherichia coli genomes finds an E. coli core genome of about 3100 gene families and a total of about 89,000 different gene families. Why do we care about bacterial genome sequencing? There are many practical applications, such as genome-scale metabolic modeling, biosurveillance, bioforensics, and infectious disease epidemiology. In the near future, high-throughput sequencing of patient metagenomic samples could revolutionize medicine in terms of speed and accuracy of finding pathogens and knowing how to treat them

    Μελέτη της SOS απόκρισης στο αιθανολοπαραγωγό βακτήριο Zymomonas mobilis

    Get PDF
    Στόχος της παρούσας διδακτορικής διατριβής υπήρξε η μελέτη της SOS απόκρισης στο Zymomonas mobilis. Η SOS απόκριση (SOS response) εκδηλώνεται στα βακτήρια σε καταστάσεις εκτεταμένης μεταλλαξογένεσης και πρόκλησης βλαβών στο DNA, και έγκειται στη συντονισμένη επαγωγή γονιδίων που εμπλέκονται κυρίως στην αντιγραφή και επιδιόρθωση του DNA ή στη ρύθμιση του κυτταρικού κύκλου. Ρυθμιστές των γονιδίων που επάγονται κατά την SOS απόκριση – των λεγόμενων SOS γονιδίων – είναι οι πρωτεΐνες RecA και LexA, από τις οποίες η πρώτη είναι η κύρια πρωτεΐνη του ομόλογου γενετικού ανασυνδυασμού και η δεύτερη ο μεταγραφικός καταστολέας όλων των SOS γονιδίων. Παρουσία βλαβών στο DNA, και δη μονόκλωνων αλυσίδων που προκύπτουν από θραύσεις, η RecA ενεργοποιείται και υποβοηθά τη LexA στην αυτοπρωτεόλυσή της. Αυτό έχει ως επακόλουθο την αποδέσμευση της τελευταίας από τις θέσεις πρόσδεσής της ανοδικά των SOS γονιδίων και την αποκαταστολή αυτών, συμπεριλαμβανομένων των recA και lexA. Η εκ νέου σύνθεση της LexA, όπως και η σταδιακή επιδιόρθωση των βλαβών, κατασιγάζει την επαγωγή και επαναφέρει τον οργανισμό στην ιδιοστατική κατάσταση. Το SOS σύστημα έχει κατά κύριο λόγο μελετηθεί στο γ-πρωτεοβακτήριο Escherichia coli, αλλά στοιχεία του εύρους και των λειτουργιών του ανακαλύπτονται προσφάτως και σε άλλους οργανισμούς, όπως τα α-πρωτεοβακτήρια. Το Zymomonas mobilis είναι ζυμωτικό α-πρωτεοβακτήριο με έντονο βιοτεχνολογικό ενδιαφέρον εξαιτίας της ικανότητάς του για παραγωγή αιθανόλης με σχεδόν τέλειους ρυθμούς και αποδόσεις, καθώς και προϊόντων υψηλής προστιθέμενης αξίας. Η δυνατότητα ζύμωσης υδρολυμάτων αμυλώδους ή αδρής βιομάζας καθιστούν προσφάτως τον οργανισμό αυτό εξαιρετικά σημαντικό στην παραγωγή βιοκαυσίμων (βιοαιθανόλης) πρώτης και δεύτερης γενιάς. Για τον λόγο αυτό, στο εργαστήριο μελετάται ο συγκεκριμένος οργανισμός σε επίπεδο γενετικό, γονιδιωματικό και κατασκευής στελεχών. Η μελέτη της SOS απόκρισης στο Z. mobilis ενδιέφερε στα πλαίσια της παρούσας διατριβής καθώς θα διαφώτιζε τη συμπεριφορά του οργανισμού σε συνθήκες μεταλλακτικού στρες και θα αναδείκνυε επίσης το πρώτο επαγώγιμο σύστημα γονιδίων που ουδέποτε έχει χαρακτηριστεί σ’ αυτόν. Εργαλεία για τη μελέτη αποτέλεσαν (α) ένα στέλεχος recA- που δημιουργήθηκε με απαλοιφή του γονιδίου recA του βιομηχανικού στελέχους Z. mobilis CP4 και (β) βιοπληροφορική ανάλυση των γονιδίων recA και lexA και των προβλεπόμενων προϊόντων τους, καθώς και ανάλυση των πρώτων αλληλουχημένων γονιδιωμάτων του Z. mobilis για ενδείξεις στοιχείων SOS-ρύθμισης, που πραγματοποιήθηκαν σε προηγούμενες έρευνες του υποψηφίου διδάκτορα. Στην παρούσα διατριβή, επεκτάθηκαν οι μελέτες στο κατασκευασμένο CP4 recA- στέλεχος, το οποίο ονομάστηκε UA1. Επιβεβαιώθηκε με μοριακή ανάλυση η καθαρότητα και μοναδικότητα της εισδοχής του γονιδίου της ακετυλοτρανσφεράσης της χλωραμφαινικόλης (catΕ), που είχε χρησιμοποιηθεί για τη γονιδιακή απαλοιφή του ενδογενούς recA, και διαπιστώθηκε η διατήρηση της ανθεκτικότητας του UA1 στη χλωραμφαινικόλη σε συνεχείς ανακαλλιέργειες άνευ πίεσης επιλογής, γεγονός που πιστοποιεί τον σταθερά μεταλλαγμένο του χαρακτήρα. Το UA1 μελετήθηκε επίσης ως προς τις παραμέτρους αύξησής του σε πλήρες και ελάχιστο θρεπτικό υλικό, σε αερόβιες και αναερόβιες συνθήκες, και παρουσία μεταλλαξογόνων, όπως υπεριώδους ακτινοβολίας (UV) και μεθυλ-μεθανοσουλφονικού οξέως (MMS). Απεδείχθη εν γένει πιο αργό στην ανάπτυξη από το πατρικό, περισσότερο θνησιγενές σε φάση στασιμότητας και υπερευαίσθητο κατά πολλές τάξεις μεγέθους στα μεταλλαξογόνα. Τέλος, και σε πλήρη συμφωνία με τον recA- γονότυπό του, το UA1 απεδείχθη ανίκανο να προβαίνει σε ομόλογο γενετικό ανασυνδυασμό. Για να εξεταστεί εάν η υστέρηση στην ανάπτυξη του UA1 αντανακλά και σε ελαττωμένη παραγωγή αιθανόλης, ελέγχθηκαν η παραγωγή αιθανόλης αυτού και του πατρικού στελέχους σε διαφορετικές φάσεις ανάπτυξης με υγρή και αέριο χρωματογραφία. Και με τις δύο τεχνικές φάνηκε ότι το UA1 παράγει περίπου 3,5 φορές περισσότερη αιθανόλη από το CP4 και η διαφορά αυτή είναι αξιοσημείωτα μεγαλύτερη (5,6 φορές) στη μέση εκθετική φάση αύξησης και όταν η παραγωγή ανάγεται προς τον αριθμό κυττάρων. Για να διαφανεί, τέλος, η χρησιμότητα του στελέχους UA1 ως εργαλείου σε κατευθύνσεις γενετικής μηχανικής, ελέγχθηκε η δυνατότητά του να προσλαμβάνει DNA μέσω μετασχηματισμού και μέσω σύζευξης. Φάνηκε ότι μετασχηματίζεται με συχνότητες 4-10 φορές χαμηλότερες από το CP4 και συζεύγνηται με συχνότητες ίσες έως 10 φορές χαμηλότερες ανάλογα το παρακινούμενο πλασμίδιο, άρα είναι αρκούντως δεκτικό σε διαδικασίες που απαιτούν εισαγωγές γονιδίων. Tα recA- στελέχη των περισσοτέρων μικροοργανισμών είναι εξαιρετικά χρήσιμα στη γενετική μηχανική καθώς σταθεροποιούν και δεν ανακατατάσσουν το ξένο γενετικό υλικό που εισάγεται σε αυτά. Για τον λόγο αυτό, καθώς και για τις υπόλοιπες ιδιότητες που προαναφέρθηκαν, το UA1, ως το πρώτο και μόνο recA αρνητικό στέλεχος του Z. mobilis που έχει δημιουργηθεί, έγινε δεκτό προς κατάθεση στην παγκόσμια τράπεζα μικροβιακών στελεχών ATCC (American Type Culture Collection) με προσωρινό κωδικό AcqID-01168. Για να εξακριβωθεί η ύπαρξη δικτύου SOS γονιδίων στο πατρικό του UA1 στέλεχος CP4, έγινε υπολογιστική αναζήτηση γονιδίων που φέρουν συντηρημένους SOS χειριστές (SOS boxes), σύμφωνους με το α-πρωτεοβακτηριακό SOS μοτίβο ανοδικά των γονιδίων. Η αναζήτηση κατέδειξε τέλειους χειριστές ανοδικά 10 χρωμοσωμικών γονιδίων και 1 πλασμιδιακού, και χειριστές με μία νουκλεοτιδική αλλαγή ανοδικά 58 και 9 γονιδίων, αντίστοιχα. Ανάμεσα σε αυτά εντοπίστηκαν εκτός από επιδιορθωτικά γονίδια, γονίδια μεταβολικά, δομικά, αναπνευστικά, ρυθμιστικά, κ.ά. Ανάλογες συντηρημένες αλληλουχίες χειριστών βρέθηκαν ανοδικά των ίδιων αλληλομόρφων όλων των στελεχών Ζ. mobilis subsp. mobilis που ελέγχθηκαν και των οποίων τα γονιδιώματα είναι πλέον γνωστά (ATCC 31821, ATCC 10988, ATCC 29191 και NCIMB 11163), ενώ διαφορές παρουσιάστηκαν στον μοναδικό αλληλουχημένο αντιπρόσωπο του έτερου υποείδους του Z. mobilis, του Z. mobilis supsp. pomaceae (ΑTCC 29192), ο οποίος φέρει κάποια κοινά και αρκετά καινούργια SOS γονίδια. Επίσης εντοπίστηκαν SOS γονίδια με 0-1 νουκλεοτιδική αλλαγή στον χειριστή τους στα πλασμίδια όλων των στελεχών, με τα περισσότερα τέτοια γονίδια να είναι στελεχοειδικά. Η SOS επαγωγή μελετήθηκε διεξοδικά στα στελέχη UA1 και CP4 με αλληλούχηση του μεταγραφώματός τους κατόπιν πρόκλησης με το μεταλλαξογόνο MMS, σε κλίμακα συγκεντρώσεων που να επιφέρει μεν επαγωγή αλλά να αποτρέπει άνω της μίας δεκαδικής τάξης πτώση βιωσιμότητας για έκαστο στέλεχος (από 0 ως 0,2 mM για το UA1 και ως 15 mM για το CP4). Για τους σκοπούς της μεταγραφωματικής ανάλυσης, αναπτύχθηκε τεχνική βέλτιστης απομόνωσης RNA από το Z. mobilis, ενώ τα δείγματα εστάλησαν προς δημιουργία βιβλιοθηκών και αλληλούχηση στο US DOE – Joint Genome Institute. Η ανάλυση των μεταγράφων απέδειξε ότι υπό φυσιολογικές συνθήκες και στα δύο στελέχη μεταγράφεται το 97% των προβλεπόμενων χρωμοσωμικών γονιδίων του γονιδιώματος και το 89% των πλασμιδιακών. Σε επίπεδο διαφορικής έκφρασης στις κοινές εφαρμοζόμενες συγκεντρώσεις του MMS, συνολικά 9 διαφορετικά γονίδια του UA1 και 67 του CP4 (διαφορετικά από τα πρώτα), συμπεριλαμβανομένων τριών κλασικών επιδιορθωτικών γονιδίων, φάνηκαν να επάγονται ή καταστέλλονται. Στο UA1 κανένα επιδιορθωτικό γονίδιο δεν επάχθηκε επιβεβαιώνοντας τον μόνιμα κατασταλμένο φαινότυπό του. Το σύνολο των γονιδίων του CP4 που είχαν διαφορική έκφραση σε συνθήκες SOS επαγωγής – το λεγόμενο SOS stimulon – φάνηκε να αριθμεί από 60 γονίδια στην χαμηλότερη συγκέντρωση του μεταλλαξογόνου έως 1.215 στην υψηλότερη (το 73% των μεταγραφόμενων γονιδίων). Χαρακτηριστικά υπερεκφραζόμενα γονίδια, συχνά συμμεταγραφόμενα, υπήρξαν επιδιορθωτικά, συγκρότησης φάγων, απόκρισης σε στρες και σε αντιμικροβιακούς παράγοντες, ρυθμιστικά κ.ά., ενώ χαρακτηριστικά υποεκφραζόμενα ήταν γονίδια του μεταφραστικού μηχανισμού. Για να βρεθεί το αυστηρώς νοούμενο SOS σύστημα στο Z. mobilis (: το SOS regulon εντός του SOS stimulon), δηλαδή αυτό που ρυθμίζεται από τη LexA και τα γονιδιακά μέλη του οποίου φέρουν μοτίβα SOS χειριστών, αναζητήθηκε υπολογιστικά το σύνολο των επιδιορθωτικών γονιδίων του CP4, καθώς τα τελευταία αποτελούν γνώμονα SOS γονιδίων σε όσους οργανισμούς έχουν μελετηθεί. Φάνηκε ότι ο οργανισμός φέρει 34 γονίδια ορθόλογα με καλά χαρακτηρισμένα των γ-πρωτεοβακτηρίων, εκ των οποίων τα 17 επάγονταν από το MMS ανεξαρτήτως συγκέντρωσης. Ανοδικά και των 17 εντοπίστηκαν μοτίβα SOS χειριστών με 0-3 νουκλεοτιδικές αλλαγές συγκριτικά με το τέλειο συναινετικό μοτίβο. Με βάση αυτό το κριτήριο χαλαρότητας του μοτίβου, αναζητήθηκαν τα διαφορικά εκφραζόμενα γονίδια του CP4 στο σύνολο όλων που αντέδρασαν στο ΜΜS και φέρουν ανάλογους SOS χειριστές. Εντοπίστηκαν 340 υπερεκφραζόμενα και 310 υποεκφραζόμενα γονίδια. Τα περισσότερα από αυτά, εκτός των επιδιορθωτικών που προαναφέρθηκαν, συμμετέχουν στη μεταφορά ουσιών, αναδίπλωση πρωτεϊνών, μεταβολισμό υδατανθράκων και αμινοξέων, παραγωγή ενέργειας και τη μεταφραστική μηχανή. SOS-ρυθμιζόμενα γονίδια εντοπίστηκαν και στα πλασμίδια, και ευθύνονται για λειτουργίες όπως μετάθεση και τροποποίηση/περιορισμό του DNA ή συγκρότηση φάγων. Τα περισσότερα γονίδια αυτού του συνόλου πρώτη φορά αναφέρονται ως SOS γονίδια. Ο εντοπισμός των SOS γονιδίων στο Z. mobilis βοήθησε στην εξεύρεση του ιδιαίτερου μοτίβου που χαρακτηρίζει έναν SOS χειριστή στον οργανισμό, μοτίβου, δηλαδή, που να μπορεί να χρησιμοποιηθεί ως γνώμονας στη βιοπληροφορική αναζήτηση SOS-ρυθμιζόμενων γονιδίων σε διαφορετικά στελέχη του οργανισμού ή και να διαφωτίσει την SOS ρύθμιση στα α-πρωτεοβακτήρια εν γένει. Για τον σκοπό αυτό στοιχήθηκαν όλοι οι διαμορφωμένοι με τα άνω κριτήρια πιθανοί SOS χειριστές και φάνηκε ότι εσωτερικά δινουκλεοτίδια των επαναλαμβανόμενων τετραμερών των ολικών μοτίβων είναι συντηρημένα άνω του 95% σε σχέση με τα εξωτερικά νουκλεοτίδια των τετραμερών (συντήρηση 30-40%). Επιπλέον, παρατηρήθηκε τάση προτίμησης για βάσεις A/T τόσο στο εσωτερικό των μοτίβων όσο και εκατέρωθεν αυτών. Τέλος, βρέθηκε ότι το 87% των SOS μοτίβων εντοπίζεται έως 200 bp από τη μεταφραστική έναρξη του εκάστοτε γονιδίου. Σε επίπεδο σύγκλισης των in silico προβλέψεων με τα πειραματικά αποτελέσματα της μεταγραφωματικής ανάλυσης στην παρούσα εργασία, φάνηκε ότι οι βιοπληροφορικές προβλέψεις γονιδίων με SOS χειριστές με 0 ή 1 νουκλεοτιδική αλλαγή επιβεβαιώθηκαν κατά 91,7% και 53,5%, αντίστοιχα. Όμως, οι προβλέψεις κάλυψαν μόνο το 9,4% του συνόλου των γονιδίων που έφεραν SOS χειριστές με τα άνω κριτήρια και είχαν διαφορική έκφραση, καταδεικνύοντας έτσι ότι η πρόβλεψη για χειριστές με 0-1 αλλαγή, που είναι η ευρέως χρησιμοποιούμενη σε συναφείς δημοσιεύσεις, δεν επαρκεί για την εξεύρεση όλου του ρυθμιστικού συστήματος (regulon). Τέλος, στην εργασία αυτή, σημειώθηκε πρωταρχική μελέτη των υποκινητών των γονιδίων recA και lexA του CP4 ως μοντέλων μοριακής αλληλεπίδρασης της LexA πρωτεΐνης με τον SOS χειριστή. Για τον σκοπό αυτό κλωνοποιήθηκαν οι ευρύτερες περιοχές ανοδικά των γονιδίων recA και lexA σε πλασμίδιο ελέγχου μεταγραφικής ενεργότητας σταθερό σε α- και γ-πρωτεοβακτήρια, και εισήχθησαν τα κατασκευασμένα πλασμίδια σε κύτταρα (α) E. coli, που εξέφραζαν ή όχι in trans τη LexA του CP4 από φορέα υπερέκφρασης, και (β) A. tumefaciens, που εξέφραζαν in trans την οικεία χρωμοσωμική και ομόλογη με του Z. mobilis, LexA, εφόσον προσπάθειες να εισαχθούν στο ίδιο το Z. mobilis δεν τελεσφόρησαν. Οι υποκινητές αποδείχθηκαν ενεργοί και στους δύο ξενιστές με δυνατότερο αυτόν του recA. Η παρουσία της LexA του Z. mobilis στο E. coli οδήγησε σε καταστολή έως και ~60%, ενθαρρύνοντας το εγχείρημα της μελέτης μοριακών αλληλεπιδράσεων χειριστή – καταστολέα στον οργανισμό αυτό. Eπίσης, στο A. tumefaciens και κατόπιν SOS επαγωγής, υπήρξε οριακή αποκαταστολή των υποκινητών, αναδεικνύοντας και πάλι ότι με βελτίωση του ετερόλογου αυτού συστήματος δύναται να πραγματοποιηθεί η επιθυμητή μελέτη.The subject of this dissertation has been the study of the SOS response in Zymomonas mobilis. The SOS response is manifested in bacteria during conditions of extensive mutagenesis and DNA damage, and entails the coordinated induction of genes mainly involved in DNA replication and repair, and cell-cycle control. Regulators of genes expressed at SOS induction (the so-called SOS genes) are the proteins RecA and LexA, the first of which is the main homologous recombination protein and the second the transcriptional repressor of all SOS genes. In presence of damaged DNA and in specific ssDNA resulting from breaks, RecA is activated and assists LexA in its autocleavage and release from bound sites upstream from SOS genes. The last results in SOS-gene derepression, including that of genes coding for the SOS regulators. The gradual repair of lesions and the build-up of intact LexA stifle the response and restore the organism’s constitutive state. The SOS system has been predominantly studied in the γ-proteobacterium Escherichia coli; however, elements of its constituents are being continuously discovered in other proteobacterial classes, such as the α-proteobacteria, and even other bacterial phyla. Zymomonas mobilis is a fermentative α-proteobacterium with a considerable biotechnological impact due to its ability to produce ethanol at near perfect rates and yields, as well as other high-added-value products. Its ability to ferment starchy or lignocellulosic biomass hydrolysates has recently rendered the organism important for the production of first and second generation bioethanol. Our laboratory is working several decades now on Z. mobilis as a model organism and studies its genetics, genomics and amenability to strain engineering. The study of the SOS response in Z. mobilis was of interest in this doctoral thesis, as it would address the ability of the organism to withstand mutational stress. It would also lead to the extrapolation and characterization of the first inducible genetic system for this bacterium. Preliminary results enabling the study of SOS in Z. mobilis were: (a) the generation of a recA- knock-out strain for the industrial strain CP4, and (b) bioinformatic analyses of the recA and lexA genes and their predicted protein products, as well as whole-genome searches for LexA binding motifs (SOS boxes) in available Z. mobilis genome sequences, obtained by the candidate during previous research. In this thesis, the CP4 recA- knock-out strain constructed in the laboratory, namely UA1, was further studied to a molecular and phenotypic level. The insertion of the chloramphenicol acetyltransferase gene (catE) into the native recA gene by means of allele exchange was confirmed by PCR and southern hybridizations. Additionally, the resistance of UA1 to chloramphenicol, the insertional inactivation marker, was verified for many generations of UA1 growth without selection pressure, proving the stability of the new strain. UA1 was also studied for growth in complete and minimal medium, in aerobic and anaerobic conditions, and in the presence of mutagens such as ultraviolet light (UV) and the alkylating agent methyl methanesulfonate (MMS). It was generally slower in growth than the parental strain, less viable at stationary phase, and many orders of magnitude more sensitive to the mutagens. Finally, and in accordance with its recA- nature, UA1 was unable to perform homologous recombination. In order to examine whether the slow growth of UA1 also led to reduced ethanol production, the latter was monitored for UA1 and the parental CP4, at different stages of growth, by both liquid and gas chromatography. Both analytical methods demonstrated that UA1 produces 3.5 times more ethanol than CP4, and this difference is notably greater (5.6 times) at mid-log phase and when cell numbers are taken into account. Finally, to assess the usefulness of UA1 in genetic engineering applications, its ability to receive DNA via transformation and conjugation was tested. UA1 appeared to be transformed 4- to 10-times less than the parental CP4, while it received DNA in matings equally well to 10-fold less, depending on the plasmid transferred. The latter indicated that UA1 can sufficiently act as a host for foreign gene introduction purposes. recA-deficient strains of most microorganisms are extremely useful in genetic engineering endeavors, as they maintain the fidelity of the foreign genetic material introduced to them and eliminate homologous recombination-dependent rearrangements. Being the first recA-deficient Z. mobilis strain ever created, UA1 was submitted to the American Type Culture Collection (ATCC) and received the temporary code number AcqID-01168. In order to verify the existence of an SOS gene network in the parental to UA1 strain CP4, a computational search was performed for genes carrying conserved α-proteobacterial SOS boxes upstream from their transcriptional starts. Perfect boxes were identified upstream from 10 chromosomal and 1 plasmid genes, while boxes with one nucleotide mismatch were found upstream from 58 and 9 genes, respectively. Among these were DNA repair genes, metabolic, structural, respiratory, regulatory genes, and genes of other functions. Similar conserved operator sequences were found upstream from same alleles in all Z. mobilis subsp. mobilis strains tested – those whose genomes were to date known (ATCC 31821, ATCC 10988, ATCC 29191 and NCIMB 11163) – while differences were observed in the only sequenced representative of the Z. mobilis subsp. pomaceae taxon (strain ATCC 29192), which was found to carry several SOS genes in common with subsp. mobilis strains as well as new ones. SOS genes preceded by boxes with 0-1 nucleotide mismatch were also detected in the plasmids of all strains, with most such genes being notably strain-specific. Τhe SOS induction was extensively studied in strains UA1 and CP4 via transcriptome sequencing. The strains were challenged with the mutagen MMS at concentrations ranging from 0 to 0.2 mM for UA1 and to 15 mM for CP4. These concentrations were chosen on grounds of being inductive yet preventing survival drops more than one order of magnitude in each case. For transcriptomic analysis, an optimal RNA isolation protocol for Z. mobilis was developed and the samples sent for library construction and sequencing at the US DOE – Joint Genome Institute. Transcript analysis demonstrated that under normal conditions 97% of the predicted chromosome coding genes and 89% of plasmid genes are transcribed in both strains. In terms of differential expression, and at the low MMS concentrations employed in both strains, a total of 9 UA1 genes and 67 CP4 genes, different from those of UA1, appeared to be induced or suppressed. Among genes induced in CP4, present were three well-characterized SOS genes. In UA1 no DNA repair gene was induced, confirming its permanently suppressed phenotype. The group of CP4 genes that exhibited differential expression under SOS induction – the so-called SOS stimulon – numbered from 60 genes at the lowest mutagen concentration to 1,215 at the highest (73% of transcribed genes). Typical over-expressed genes, often co-transcribed, were genes for DNA repair, phage assembly, stress response, antimicrobial resistance and regulation, while characteristic under-expressed genes were those of the translation machinery. To determine the strictly-sensed SOS system in Z. mobilis, e.g. the SOS (LexA) regulon within the SOS stimulon, the DNA repair genes of CP4 were sought computationally, since repair genes stand as archetypical SOS members in all organisms studied. It appeared that CP4 carries 34 DNA repair genes orthologous to well-characterized ones of the γ-proteobacteria, 17 of which were induced by MMS at any of the concentrations employed. Upstream from all 17 genes, SOS boxes were detected with 0 to 3 nucleotide mismatches compared to the perfect consensus motif. This criterion trained the search for differentially expressed genes carrying similarly heterologous SOS boxes among all differentially expressed genes. 340 over-expressed and 310 under-expressed genes were detected, which apparently comprise the Z. mobilis SOS regulon. Apart from DNA repair genes, genes involved in transportation, protein folding, carbohydrate and amino acid metabolism, energy production and the translation machinery were encountered. SOS-regulated genes were also identified in the plasmids and found to be responsible for functions such as DNA transposition, DNA restriction and modification, and phage assembly. Most genes in this category are characterized as SOS-dependent for the first time. The determination of SOS genes in Z. mobilis led to the discovery of the particular motif characterizing the SOS box in the organism. This motif can serve in bioinformatic searches for SOS-regulated genes in yet other Z. mobilis strains or even pose as paradigm for SOS regulation in the α-proteobacteria in general. It appeared that in the Z. mobilis SOS-box motif, the internal dinucleotides of motif tetramers are over 95% conserved, in contrast to outer nucleotides of the tetramers (30-40% conserved). In addition, a trend for A/T preference was observed both in spacer regions and in regions flanking the motif. Finally, it was found that 87% of the SOS motifs are located up to 200 bp from translational starts of regulated genes. Examining the convergence between the in silico predictions and the experimental results of the transcriptomic analysis in the present study, it became apparent that the bioinformatic predictions for genes with SOS boxes bearing 0 or 1 nucleotide mismatch were 91.7% and 53.5% confirmed, respectively. However, these predictions accounted for only 9.4% of genes recognized in this work as SOS genes by means of both the computational and expression criteria set. Given that the search for boxes bearing 0 or 1 mismatch has been the norm in characterizing SOS genes
    corecore