research

Od sekvencije DNA do kemijske strukture – pretraživanje mikrobnih genomskih i metagenomskih skupova podataka radi pronalaženja novih prirodnih spojeva

Abstract

Rapid mining of large genomic and metagenomic data sets for modular polyketide synthases, non-ribosomal peptide synthetases and hybrid polyketide synthase/non-ribosomal peptide synthetase biosynthetic gene clusters has been achieved using the generic computer program packages ClustScan and CompGen. These program packages perform the annotation with the hierarchical structuring into polypeptides, modules and domains, as well as storage and graphical presentations of the data. This aims to achieve the most accurate predictions of the activities and specificities of catalytically active domains that can be made with present knowledge, leading to a prediction of the most likely chemical structures produced by these enzymes. The program packages also allow generation of novel clusters by homologous recombination of the annotated genes in silico. ClustScan and CompGen were used to construct a custom database of known compounds (CSDB) and of predicted entirely novel recombinant products (r-CSDB) that can be used for in silico screening with computer aided drug design technology. The use of these programs has been exemplified by analysing genomic sequences from terrestrial prokaryotes and eukaryotic microorganisms, a marine metagenomic data set and a newly discovered example of a \u27shared metabolic pathway\u27 in marine-microbial endosymbiosis.Brzo pretraživanje genomskih i metagenomskih skupova podataka, modularnih biosintetskih genskih nakupina poliketid sintaza i sintetaza neribosomalno sintetiziranih peptida, postignuto je primjenom generičkih računalnih programskih paketa ClustScan i CompGen. Ti programski paketi provode anotaciju hijerarhijskim strukturiranjem podataka na polipeptide, module i domene, te pohranu i grafičku prezentaciju tih podataka. Na temelju dosadašnjih spoznaja, nastoji se postići najtočnije moguće predviđanje aktivnosti i specifičnosti katalitički aktivnih domena, što vodi prema predviđanju najvjerojatnijih kemijskih struktura koje ti enzimi mogu sintetizirati. Programski paketi ClustScan i CompGen omogućuju generiranje novih genskih nakupina homolognom rekombinacijom anotiranih gena u uvjetima in silico, a upotrijebljeni su i za konstrukciju vlastitih baza podataka poznatih poliketidnih i peptidnih supstancija (CSDB) te potpuno novih poliketidnih i peptidnih supstancija produkata rekombinacije (r-CSDB). Ti će se produkti rekombinacije moći upotrijebiti za izbor supstancija s potencijalnom biološkom aktivnošću pomoću računalom vođenog dizajna lijekova u uvjetima in silico. Primjenjivost programskih paketa ClustScan i CompGen dokazana je u analizi genomskih sekvencija prokariotskih i eukariotskih mikroorganizama što žive u tlu, analizi metagenomske skupine podataka u uzorku iz morske vode, a i na nedavno opisanom primjeru \u27zajedničkog metaboličkoga puta\u27 u mikrobnog endosimbionta morske životinje

    Similar works