4 research outputs found
Exploiting Codon-Triplets Association for Genome Primary Structure Analysis
Abstract— The way evolution shapes the arrangement of synonymous codons within open reading frames (ORF) for fine tuning mRNA decoding efficiency is not yet understood. Since the
ribosome has 3 tRNA binding sites, the context of triplets should be relevant to decoding fidelity and efficiency. We have developed a software application for large-scale analysis of codon-triplet associations to shed new light into this problem. The developed algorithms identify codon-triplets context biases, allowing for large scale comparative codon-triplet analysis and for identification of alterations to the standard genetic code
Análise de repetições em dados biológicos
The decoding of the genomes has created new challenges on the scientific community linked to the area of computation and information technologies. Daily, new data is added to numerous databases with billions of records, coming from more advanced equipment, helping in decoding the genomes. Determine how important and relevant are these data in order to find value-added information and obviously turn them into knowledge,is the main challenge for the bioinformatics research community. The analysis of genomes and proteomes of several organisms allow us to observe the behaviour at the evolution of species. In this study, our focus goes to a particular aspect of this analysis: the repetition of some codons and their amino acids inside several orthologous genes in eukaryotic organisms. Belonging to different stages of evolution, the main objective focuses on achieving results on the evolution of these repetitions over millions of years. We now know that these repetitions in humans are the source of several neurodegenerative diseases among others. This analysis will verify the conservation or repression, of these repetitions throughout the process of speciation as well at the level of relationship that may exist between these repetitions and those diseases. For this study we have developed an algorithm for A descodificação dos genomas veio criar novos desafios na comunidade cientÃfica ligada à área da computação e da informática. Diariamente são alimentadas inúmeras bases de dados com biliões de registos provenientes de equipamentos cada vez mais evoluÃdos, que auxiliam na descodificação dos genomas. Determinar o quão importante e relevante são esses dados, de forma a retirar valor acrescentado – informação, e obviamente transformá-los em conhecimento, é o grande desafio actual para a comunidade de investigadores de bioinformática. A análise de genomas, bem como dos proteomas dos vários organismos permitem-nos observar o comportamento ao nÃvel da evolução das espécies. Neste estudo focamos a atenção num aspecto particular dessa análise: as repetições de determinados codões e dos respectivos aminoácidos nos vários organismos eucariotas, especificamente em genes ortólogos. Pertencente a várias fases da evolução das espécies, o objectivo principal centra-se na obtenção de resultados quanto à evolução dessas repetições ao longo de milhões de anos. Sabemos hoje que essas repetições no ser humano são a causa de diversas doenças neuro-degenerativas, entre outras, pelo que esta análise permitirá verificar o estado de conservação ou repressão, dessas repetições ao longo do processo de especiação, bem como ao nÃvel do relacionamento que poderá existir entre essas repetições e as doenças nos seres superiormente evoluÃdos. Para este estudo foi desenvolvido um algoritmo de detecção de padrões de repetição, que possibilita uma análise detalhada da localização de uma determinada sequência, bem como das sequências que melhor se ajustam ao padrão de repetição inicial.Centro de Estudos em Educação, Tecnologias e Saúd
Análise de repetições em dados biológicos
The decoding of the genomes has created new challenges on the scientific community linked to the area of computation and information technologies. Daily, new data is added to numerous databases with billions of records, coming from more advanced equipment, helping in decoding the genomes. Determine how important and relevant are these data in order to find value-added information and obviously turn them into knowledge,is the main challenge for the bioinformatics research community. The analysis of genomes and proteomes of several organisms allow us to observe the behaviour at the evolution of species. In this study, our focus goes to a particular aspect of this analysis: the repetition of some codons and their amino acids inside several orthologous genes in eukaryotic organisms. Belonging to different stages of evolution, the main objective focuses on achieving results on the evolution of these repetitions over millions of years. We now know that these repetitions in humans are the source of several neurodegenerative diseases among others. This analysis will verify the conservation or repression, of these repetitions throughout the process of speciation as well at the level of relationship that may exist between these repetitions and those diseases. For this study we have developed an algorithm for A descodificação dos genomas veio criar novos desafios na comunidade cientÃfica ligada à área da computação e da informática. Diariamente são alimentadas inúmeras bases de dados com biliões de registos provenientes de equipamentos cada vez mais evoluÃdos, que auxiliam na descodificação dos genomas. Determinar o quão importante e relevante são esses dados, de forma a retirar valor acrescentado – informação, e obviamente transformá-los em conhecimento, é o grande desafio actual para a comunidade de investigadores de bioinformática. A análise de genomas, bem como dos proteomas dos vários organismos permitem-nos observar o comportamento ao nÃvel da evolução das espécies. Neste estudo focamos a atenção num aspecto particular dessa análise: as repetições de determinados codões e dos respectivos aminoácidos nos vários organismos eucariotas, especificamente em genes ortólogos. Pertencente a várias fases da evolução das espécies, o objectivo principal centra-se na obtenção de resultados quanto à evolução dessas repetições ao longo de milhões de anos. Sabemos hoje que essas repetições no ser humano são a causa de diversas doenças neuro-degenerativas, entre outras, pelo que esta análise permitirá verificar o estado de conservação ou repressão, dessas repetições ao longo do processo de especiação, bem como ao nÃvel do relacionamento que poderá existir entre essas repetições e as doenças nos seres superiormente evoluÃdos. Para este estudo foi desenvolvido um algoritmo de detecção de padrões de repetição, que possibilita uma análise detalhada da localização de uma determinada sequência, bem como das sequências que melhor se ajustam ao padrão de repetição inicial.Centro de Estudos em Educação, Tecnologias e Saúd
Análise de tripletos e de repetições em estruturas primárias de DNA
Doutoramento em Engenharia InformáticaO desenvolvimento de equipamentos de descodificação massiva de
genomas veio aumentar de uma forma brutal os dados disponÃveis. No
entanto, para desvendarmos informação relevante a partir da análise desses
dados é necessário software cada vez mais especÃfico, orientado para
determinadas tarefas que auxiliem o investigador a obter conclusões o mais
rápido possÃvel.
É nesse campo que a bioinformática surge, como aliado fundamental da
biologia, uma vez que tira partido de métodos e infra-estruturas
computacionais para desenvolver algoritmos e aplicações informáticas. Por
outro lado, na maior parte das vezes, face a novas questões biológicas é
necessário responder com novas soluções especÃficas, pelo que o
desenvolvimento de aplicações se torna um desafio permanente para os
engenheiros de software.
Foi nesse contexto que surgiram os principais objectivos deste trabalho,
centrados na análise de tripletos e de repetições em estruturas primárias de
DNA. Para esse efeito, foram propostos novos métodos e novos algoritmos
que permitirem o processamento e a obtenção de resultados sobre grandes
volumes de dados.
Ao nÃvel da análise de tripletos de codões e de aminoácidos foi proposto
um sistema concebido para duas vertentes: por um lado o processamento dos
dados, por outro a disponibilização na Web dos dados processados, através
de um mecanismo visual de composição de consultas. Relativamente à análise
de repetições, foi proposto e desenvolvido um sistema para identificar padrões
de nucleótidos e aminoácidos repetidos em sequências especÃficas, com
particular aplicação em genes ortólogos.
As soluções propostas foram posteriormente validadas através de casos
de estudo que atestam a mais-valia do trabalho desenvolvido.The development of massive genome decoding equipment has increased
available data tremendously. Nevertheless, increasingly more specific software
is required to bring to light the relevant information from all of that data. The
software must be oriented towards certain tasks which assist the researcher in
reaching conclusions as quickly as possible.
Thus, the field of bioinformatics appears as a fundamental ally of biology,
taking advantage of computational methods and infrastructures to develop
computer algorithms and applications. On the other hand, in most cases due to
new biological issues, it is necessary to respond with specific new solutions.
Therefore, developing applications is a permanent challenge for software
engineers.
It was in this context that the main aims of this work emerge. They are
focused on analyzing triplets and repetitions in primary DNA structures. To this
end, new methods and new algorithms were proposed to allow results to be
processed and obtained from large volumes of data.
A system was designed for two strands of analysis terms of codon triplets
and amino acids. On the one hand it processes data; on the other hand, it
makes the processed data available on the Web through a query builder
mechanism. As for analyzing repetitions, a system to identify repeated
nucleotide and amino acid patterns in specific sequences was proposed and
developed, particularly applied to orthologous genes.
The solutions found were later validated through case studies which
attested the value of the contribution this work has made