8 research outputs found

    Studio delle interdistanze dei dinucleotidi CG e TA nei cromosomi umani

    Get PDF
    Il lavoro svolto in questa tesi si colloca nell’ambito delle analisi statistiche delle sequenze di DNA. In particolare sono state studiate le distribuzioni delle interdistanze dei dinucleotidi CG e TA all’interno del genoma umano. La prima parte dello studio si é occupata di effettuare una valutazione della qualitá dei dati utilizzati per le analisi. Questo perché, all’interno dei vari cromosomi che compongono il DNA, sono presenti alcuni nucleotidi che non sono stati correttamente sequenziati e le cui basi azotate sono per il momento sconosciute. É emerso che tali nucleotidi, indicati con la lettera N, sono presenti in grandi blocchi e localizzati alle estremitá ed al centro dei vari cromosomi. Si é osservato che, nonostante le numerose occorrenze, questi nucleotidi possono essere trascurati e che l’effetto della loro rimozione dalle sequenze di DNA é statisticamente irrilevante. La seconda parte delle analisi é riservata allo studio delle distribuzioni delle interdistanze del dinucleotide CG. Quello che si é visto é che tali distribuzioni sono ben descritte da una legge di potenza traslata con cutoff esponenziale. I parametri, ottenuti dal fit, assumono valori simili ad eccezione dei cromosomi 16, 17, 19, 20, 22 e Y. Particolare attenzione é stata riposta sui valori anomali del parametro del cutoff esponenziale. Nel tentativo di spiegare l’andamento di tali valori, é stata formulata un’ipotesi basata su di un possibile legame tra il parametro del cutoff esponenziale e la densitá del dinucleotide CG all’interno dei vari cromosomi. L’ultima sezione é dedicata invece allo studio delle distribuzioni delle interdistanze del dinucleotide TA. Si é visto nel cromosoma 1 che questo dinucleotide é quello che ha un andamento piú simile al dinucleotide CG. Tali distribuzioni sono state poi fittate con la legge di potenza traslata con cutoff esponenziale e con una legge di potenza traslata senza cutoff ed é emerso che sono meglio descritte dalla seconda

    Advances in Molecular Simulation

    Get PDF
    Molecular simulations are commonly used in physics, chemistry, biology, material science, engineering, and even medicine. This book provides a wide range of molecular simulation methods and their applications in various fields. It reflects the power of molecular simulation as an effective research tool. We hope that the presented results can provide an impetus for further fruitful studies

    Statistical modelling of CG interdistance across multiple organisms

    No full text
    Background: Statistical approaches to genetic sequences have revealed helpful to gain deeper insight into biological and structural functionalities, using ideas coming from information theory and stochastic modelling of symbolic sequences. In particular, previous analyses on CG dinucleotide position along the genome allowed to highlight its epigenetic role in DNA methylation, showing a different distribution tail as compared to other dinucleotides. In this paper we extend the analysis to the whole CG distance distribution over a selected set of higher-order organisms. Then we apply the best fitting probability density function to a large range of organisms (>4400) of different complexity (from bacteria to mammals) and we characterize some emerging global features. Results: We find that the Gamma distribution is optimal for the selected subset as compared to a group of several distributions, chosen for their physical meaning or because recently used in literature for similar studies. The parameters of this distribution, when applied to our larger set of organisms, allows to highlight some biologically relavant features for the considered organism classes, that can be useful also for classification purposes. Conclusions: The quantification of statistical properties of CG dinucleotide positioning along the genome is confirmed as a useful tool to characterize broad classes of organisms, spanning the whole range of biological complexity

    Statistical modelling of CG interdistance across multiple organisms

    No full text
    Abstract Background Statistical approaches to genetic sequences have revealed helpful to gain deeper insight into biological and structural functionalities, using ideas coming from information theory and stochastic modelling of symbolic sequences. In particular, previous analyses on CG dinucleotide position along the genome allowed to highlight its epigenetic role in DNA methylation, showing a different distribution tail as compared to other dinucleotides. In this paper we extend the analysis to the whole CG distance distribution over a selected set of higher-order organisms. Then we apply the best fitting probability density function to a large range of organisms (>4400) of different complexity (from bacteria to mammals) and we characterize some emerging global features. Results We find that the Gamma distribution is optimal for the selected subset as compared to a group of several distributions, chosen for their physical meaning or because recently used in literature for similar studies. The parameters of this distribution, when applied to our larger set of organisms, allows to highlight some biologically relavant features for the considered organism classes, that can be useful also for classification purposes. Conclusions The quantification of statistical properties of CG dinucleotide positioning along the genome is confirmed as a useful tool to characterize broad classes of organisms, spanning the whole range of biological complexity

    NATIONAL SYNCHROTRON LIGHT SOURCE ACTIVITY REPORT FOR THE PERIOD OCTOBER 1, 1996 THROUGH SEPTEMBER 30, 1997.

    Full text link
    corecore