Od sekvencije DNA do kemijske strukture – pretraživanje mikrobnih genomskih i metagenomskih skupova podataka radi pronalaženja novih prirodnih spojeva

Antonio Starcevic; Daslav Hranueli; Janko Diminic; John Cullum; Jurica Zucko; Mohamed Lisfi; Mouhsine Elbekali; Paul F. Long

research

Od sekvencije DNA do kemijske strukture – pretraživanje mikrobnih genomskih i metagenomskih skupova podataka radi pronalaženja novih prirodnih spojeva

Authors: Antonio Starcevic
Daslav Hranueli
Janko Diminic
John Cullum
Jurica Zucko
Mohamed Lisfi
Mouhsine Elbekali
Paul F. Long
Publication date: 1 January 2010
Publisher: Faculty of Food Technology and Biotechnology, University of Zagreb

Abstract

Rapid mining of large genomic and metagenomic data sets for modular polyketide synthases, non-ribosomal peptide synthetases and hybrid polyketide synthase/non-ribosomal peptide synthetase biosynthetic gene clusters has been achieved using the generic computer program packages ClustScan and CompGen. These program packages perform the annotation with the hierarchical structuring into polypeptides, modules and domains, as well as storage and graphical presentations of the data. This aims to achieve the most accurate predictions of the activities and specificities of catalytically active domains that can be made with present knowledge, leading to a prediction of the most likely chemical structures produced by these enzymes. The program packages also allow generation of novel clusters by homologous recombination of the annotated genes in silico. ClustScan and CompGen were used to construct a custom database of known compounds (CSDB) and of predicted entirely novel recombinant products (r-CSDB) that can be used for in silico screening with computer aided drug design technology. The use of these programs has been exemplified by analysing genomic sequences from terrestrial prokaryotes and eukaryotic microorganisms, a marine metagenomic data set and a newly discovered example of a \u27shared metabolic pathway\u27 in marine-microbial endosymbiosis.Brzo pretraživanje genomskih i metagenomskih skupova podataka, modularnih biosintetskih genskih nakupina poliketid sintaza i sintetaza neribosomalno sintetiziranih peptida, postignuto je primjenom generičkih računalnih programskih paketa ClustScan i CompGen. Ti programski paketi provode anotaciju hijerarhijskim strukturiranjem podataka na polipeptide, module i domene, te pohranu i grafičku prezentaciju tih podataka. Na temelju dosadašnjih spoznaja, nastoji se postići najtočnije moguće predviđanje aktivnosti i specifičnosti katalitički aktivnih domena, što vodi prema predviđanju najvjerojatnijih kemijskih struktura koje ti enzimi mogu sintetizirati. Programski paketi ClustScan i CompGen omogućuju generiranje novih genskih nakupina homolognom rekombinacijom anotiranih gena u uvjetima in silico, a upotrijebljeni su i za konstrukciju vlastitih baza podataka poznatih poliketidnih i peptidnih supstancija (CSDB) te potpuno novih poliketidnih i peptidnih supstancija produkata rekombinacije (r-CSDB). Ti će se produkti rekombinacije moći upotrijebiti za izbor supstancija s potencijalnom biološkom aktivnošću pomoću računalom vođenog dizajna lijekova u uvjetima in silico. Primjenjivost programskih paketa ClustScan i CompGen dokazana je u analizi genomskih sekvencija prokariotskih i eukariotskih mikroorganizama što žive u tlu, analizi metagenomske skupine podataka u uzorku iz morske vode, a i na nedavno opisanom primjeru \u27zajedničkog metaboličkoga puta\u27 u mikrobnog endosimbionta morske životinje

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Hrčak - Portal of scientific journals of Croatia

oai:hrcak.srce.hr:53634

Last time updated on 27/08/2013