4 research outputs found

    Exploiting Codon-Triplets Association for Genome Primary Structure Analysis

    Get PDF
    Abstract— The way evolution shapes the arrangement of synonymous codons within open reading frames (ORF) for fine tuning mRNA decoding efficiency is not yet understood. Since the ribosome has 3 tRNA binding sites, the context of triplets should be relevant to decoding fidelity and efficiency. We have developed a software application for large-scale analysis of codon-triplet associations to shed new light into this problem. The developed algorithms identify codon-triplets context biases, allowing for large scale comparative codon-triplet analysis and for identification of alterations to the standard genetic code

    Análise de repetições em dados biológicos

    Get PDF
    The decoding of the genomes has created new challenges on the scientific community linked to the area of computation and information technologies. Daily, new data is added to numerous databases with billions of records, coming from more advanced equipment, helping in decoding the genomes. Determine how important and relevant are these data in order to find value-added information and obviously turn them into knowledge,is the main challenge for the bioinformatics research community. The analysis of genomes and proteomes of several organisms allow us to observe the behaviour at the evolution of species. In this study, our focus goes to a particular aspect of this analysis: the repetition of some codons and their amino acids inside several orthologous genes in eukaryotic organisms. Belonging to different stages of evolution, the main objective focuses on achieving results on the evolution of these repetitions over millions of years. We now know that these repetitions in humans are the source of several neurodegenerative diseases among others. This analysis will verify the conservation or repression, of these repetitions throughout the process of speciation as well at the level of relationship that may exist between these repetitions and those diseases. For this study we have developed an algorithm for A descodificação dos genomas veio criar novos desafios na comunidade científica ligada à área da computação e da informática. Diariamente são alimentadas inúmeras bases de dados com biliões de registos provenientes de equipamentos cada vez mais evoluídos, que auxiliam na descodificação dos genomas. Determinar o quão importante e relevante são esses dados, de forma a retirar valor acrescentado – informação, e obviamente transformá-los em conhecimento, é o grande desafio actual para a comunidade de investigadores de bioinformática. A análise de genomas, bem como dos proteomas dos vários organismos permitem-nos observar o comportamento ao nível da evolução das espécies. Neste estudo focamos a atenção num aspecto particular dessa análise: as repetições de determinados codões e dos respectivos aminoácidos nos vários organismos eucariotas, especificamente em genes ortólogos. Pertencente a várias fases da evolução das espécies, o objectivo principal centra-se na obtenção de resultados quanto à evolução dessas repetições ao longo de milhões de anos. Sabemos hoje que essas repetições no ser humano são a causa de diversas doenças neuro-degenerativas, entre outras, pelo que esta análise permitirá verificar o estado de conservação ou repressão, dessas repetições ao longo do processo de especiação, bem como ao nível do relacionamento que poderá existir entre essas repetições e as doenças nos seres superiormente evoluídos. Para este estudo foi desenvolvido um algoritmo de detecção de padrões de repetição, que possibilita uma análise detalhada da localização de uma determinada sequência, bem como das sequências que melhor se ajustam ao padrão de repetição inicial.Centro de Estudos em Educação, Tecnologias e Saúd

    Análise de repetições em dados biológicos

    Get PDF
    The decoding of the genomes has created new challenges on the scientific community linked to the area of computation and information technologies. Daily, new data is added to numerous databases with billions of records, coming from more advanced equipment, helping in decoding the genomes. Determine how important and relevant are these data in order to find value-added information and obviously turn them into knowledge,is the main challenge for the bioinformatics research community. The analysis of genomes and proteomes of several organisms allow us to observe the behaviour at the evolution of species. In this study, our focus goes to a particular aspect of this analysis: the repetition of some codons and their amino acids inside several orthologous genes in eukaryotic organisms. Belonging to different stages of evolution, the main objective focuses on achieving results on the evolution of these repetitions over millions of years. We now know that these repetitions in humans are the source of several neurodegenerative diseases among others. This analysis will verify the conservation or repression, of these repetitions throughout the process of speciation as well at the level of relationship that may exist between these repetitions and those diseases. For this study we have developed an algorithm for A descodificação dos genomas veio criar novos desafios na comunidade científica ligada à área da computação e da informática. Diariamente são alimentadas inúmeras bases de dados com biliões de registos provenientes de equipamentos cada vez mais evoluídos, que auxiliam na descodificação dos genomas. Determinar o quão importante e relevante são esses dados, de forma a retirar valor acrescentado – informação, e obviamente transformá-los em conhecimento, é o grande desafio actual para a comunidade de investigadores de bioinformática. A análise de genomas, bem como dos proteomas dos vários organismos permitem-nos observar o comportamento ao nível da evolução das espécies. Neste estudo focamos a atenção num aspecto particular dessa análise: as repetições de determinados codões e dos respectivos aminoácidos nos vários organismos eucariotas, especificamente em genes ortólogos. Pertencente a várias fases da evolução das espécies, o objectivo principal centra-se na obtenção de resultados quanto à evolução dessas repetições ao longo de milhões de anos. Sabemos hoje que essas repetições no ser humano são a causa de diversas doenças neuro-degenerativas, entre outras, pelo que esta análise permitirá verificar o estado de conservação ou repressão, dessas repetições ao longo do processo de especiação, bem como ao nível do relacionamento que poderá existir entre essas repetições e as doenças nos seres superiormente evoluídos. Para este estudo foi desenvolvido um algoritmo de detecção de padrões de repetição, que possibilita uma análise detalhada da localização de uma determinada sequência, bem como das sequências que melhor se ajustam ao padrão de repetição inicial.Centro de Estudos em Educação, Tecnologias e Saúd

    Análise de tripletos e de repetições em estruturas primárias de DNA

    Get PDF
    Doutoramento em Engenharia InformáticaO desenvolvimento de equipamentos de descodificação massiva de genomas veio aumentar de uma forma brutal os dados disponíveis. No entanto, para desvendarmos informação relevante a partir da análise desses dados é necessário software cada vez mais específico, orientado para determinadas tarefas que auxiliem o investigador a obter conclusões o mais rápido possível. É nesse campo que a bioinformática surge, como aliado fundamental da biologia, uma vez que tira partido de métodos e infra-estruturas computacionais para desenvolver algoritmos e aplicações informáticas. Por outro lado, na maior parte das vezes, face a novas questões biológicas é necessário responder com novas soluções específicas, pelo que o desenvolvimento de aplicações se torna um desafio permanente para os engenheiros de software. Foi nesse contexto que surgiram os principais objectivos deste trabalho, centrados na análise de tripletos e de repetições em estruturas primárias de DNA. Para esse efeito, foram propostos novos métodos e novos algoritmos que permitirem o processamento e a obtenção de resultados sobre grandes volumes de dados. Ao nível da análise de tripletos de codões e de aminoácidos foi proposto um sistema concebido para duas vertentes: por um lado o processamento dos dados, por outro a disponibilização na Web dos dados processados, através de um mecanismo visual de composição de consultas. Relativamente à análise de repetições, foi proposto e desenvolvido um sistema para identificar padrões de nucleótidos e aminoácidos repetidos em sequências específicas, com particular aplicação em genes ortólogos. As soluções propostas foram posteriormente validadas através de casos de estudo que atestam a mais-valia do trabalho desenvolvido.The development of massive genome decoding equipment has increased available data tremendously. Nevertheless, increasingly more specific software is required to bring to light the relevant information from all of that data. The software must be oriented towards certain tasks which assist the researcher in reaching conclusions as quickly as possible. Thus, the field of bioinformatics appears as a fundamental ally of biology, taking advantage of computational methods and infrastructures to develop computer algorithms and applications. On the other hand, in most cases due to new biological issues, it is necessary to respond with specific new solutions. Therefore, developing applications is a permanent challenge for software engineers. It was in this context that the main aims of this work emerge. They are focused on analyzing triplets and repetitions in primary DNA structures. To this end, new methods and new algorithms were proposed to allow results to be processed and obtained from large volumes of data. A system was designed for two strands of analysis terms of codon triplets and amino acids. On the one hand it processes data; on the other hand, it makes the processed data available on the Web through a query builder mechanism. As for analyzing repetitions, a system to identify repeated nucleotide and amino acid patterns in specific sequences was proposed and developed, particularly applied to orthologous genes. The solutions found were later validated through case studies which attested the value of the contribution this work has made
    corecore