research

Maksimalne klike u analizi sličnosti proteinskih motiva

Abstract

Pretpostavka ili hipoteza u ovom radu je da struktura odgovora dobivenog iterativnim pretraživanjem proteoma nekog organizma korespondira biološkoj značajnosti odgovora. Proveli smo analizu odgovora dobivenih iterativnim pretraživanjem 4 biljna i jednog bakterijskog proteoma u odnosu na 5 upita. Na svim odgovorima tražili smo najveću kliku 0-1 grafa pridruženog odgovoru i dobili vrlo slične rezultate. Najveće klike biološki značajnih odgovora su sačuvale oko 70% odgovora dok su se ostale najveće klike raspale. Time smo pokazali da zaista postoji korespondencija između strukture i biološke značajnosti odgovora te da bi na osnovi veličine najveće klike mogli donijeti zaključak o biološkoj značajnosti odgovora. Također, na najvećim klikama biološki značajnih odgovora se povećavaju vrijednosti PPV-a, odnosno najveće klike sadrže veći udio pravih pozitivaca nego odgovori.This work is concerned with the analysis of the iterative scanning response. We analyze responses for various queries against 4 plant and 1 bacterial proteome. We introduce a weighted graph structure on the response and, after certain adjustments, apply a maximal clique algorithm. We show that the size of the maximal clique corresponds strongly to the biological significance of the response. Furthermore, we show that the maximal clique captures the true positive part of the response very reliably

    Similar works