Análise de tripletos e de repetições em estruturas primárias de DNA

Abstract

Doutoramento em Engenharia InformáticaO desenvolvimento de equipamentos de descodificação massiva de genomas veio aumentar de uma forma brutal os dados disponíveis. No entanto, para desvendarmos informação relevante a partir da análise desses dados é necessário software cada vez mais específico, orientado para determinadas tarefas que auxiliem o investigador a obter conclusões o mais rápido possível. É nesse campo que a bioinformática surge, como aliado fundamental da biologia, uma vez que tira partido de métodos e infra-estruturas computacionais para desenvolver algoritmos e aplicações informáticas. Por outro lado, na maior parte das vezes, face a novas questões biológicas é necessário responder com novas soluções específicas, pelo que o desenvolvimento de aplicações se torna um desafio permanente para os engenheiros de software. Foi nesse contexto que surgiram os principais objectivos deste trabalho, centrados na análise de tripletos e de repetições em estruturas primárias de DNA. Para esse efeito, foram propostos novos métodos e novos algoritmos que permitirem o processamento e a obtenção de resultados sobre grandes volumes de dados. Ao nível da análise de tripletos de codões e de aminoácidos foi proposto um sistema concebido para duas vertentes: por um lado o processamento dos dados, por outro a disponibilização na Web dos dados processados, através de um mecanismo visual de composição de consultas. Relativamente à análise de repetições, foi proposto e desenvolvido um sistema para identificar padrões de nucleótidos e aminoácidos repetidos em sequências específicas, com particular aplicação em genes ortólogos. As soluções propostas foram posteriormente validadas através de casos de estudo que atestam a mais-valia do trabalho desenvolvido.The development of massive genome decoding equipment has increased available data tremendously. Nevertheless, increasingly more specific software is required to bring to light the relevant information from all of that data. The software must be oriented towards certain tasks which assist the researcher in reaching conclusions as quickly as possible. Thus, the field of bioinformatics appears as a fundamental ally of biology, taking advantage of computational methods and infrastructures to develop computer algorithms and applications. On the other hand, in most cases due to new biological issues, it is necessary to respond with specific new solutions. Therefore, developing applications is a permanent challenge for software engineers. It was in this context that the main aims of this work emerge. They are focused on analyzing triplets and repetitions in primary DNA structures. To this end, new methods and new algorithms were proposed to allow results to be processed and obtained from large volumes of data. A system was designed for two strands of analysis terms of codon triplets and amino acids. On the one hand it processes data; on the other hand, it makes the processed data available on the Web through a query builder mechanism. As for analyzing repetitions, a system to identify repeated nucleotide and amino acid patterns in specific sequences was proposed and developed, particularly applied to orthologous genes. The solutions found were later validated through case studies which attested the value of the contribution this work has made

Similar works

Full text

thumbnail-image

Repositório Institucional da Universidade de Aveiro

redirect
Last time updated on 03/09/2013

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.