Doutoramento em Engenharia InformáticaO desenvolvimento de equipamentos de descodificação massiva de
genomas veio aumentar de uma forma brutal os dados disponíveis. No
entanto, para desvendarmos informação relevante a partir da análise desses
dados é necessário software cada vez mais específico, orientado para
determinadas tarefas que auxiliem o investigador a obter conclusões o mais
rápido possível.
É nesse campo que a bioinformática surge, como aliado fundamental da
biologia, uma vez que tira partido de métodos e infra-estruturas
computacionais para desenvolver algoritmos e aplicações informáticas. Por
outro lado, na maior parte das vezes, face a novas questões biológicas é
necessário responder com novas soluções específicas, pelo que o
desenvolvimento de aplicações se torna um desafio permanente para os
engenheiros de software.
Foi nesse contexto que surgiram os principais objectivos deste trabalho,
centrados na análise de tripletos e de repetições em estruturas primárias de
DNA. Para esse efeito, foram propostos novos métodos e novos algoritmos
que permitirem o processamento e a obtenção de resultados sobre grandes
volumes de dados.
Ao nível da análise de tripletos de codões e de aminoácidos foi proposto
um sistema concebido para duas vertentes: por um lado o processamento dos
dados, por outro a disponibilização na Web dos dados processados, através
de um mecanismo visual de composição de consultas. Relativamente à análise
de repetições, foi proposto e desenvolvido um sistema para identificar padrões
de nucleótidos e aminoácidos repetidos em sequências específicas, com
particular aplicação em genes ortólogos.
As soluções propostas foram posteriormente validadas através de casos
de estudo que atestam a mais-valia do trabalho desenvolvido.The development of massive genome decoding equipment has increased
available data tremendously. Nevertheless, increasingly more specific software
is required to bring to light the relevant information from all of that data. The
software must be oriented towards certain tasks which assist the researcher in
reaching conclusions as quickly as possible.
Thus, the field of bioinformatics appears as a fundamental ally of biology,
taking advantage of computational methods and infrastructures to develop
computer algorithms and applications. On the other hand, in most cases due to
new biological issues, it is necessary to respond with specific new solutions.
Therefore, developing applications is a permanent challenge for software
engineers.
It was in this context that the main aims of this work emerge. They are
focused on analyzing triplets and repetitions in primary DNA structures. To this
end, new methods and new algorithms were proposed to allow results to be
processed and obtained from large volumes of data.
A system was designed for two strands of analysis terms of codon triplets
and amino acids. On the one hand it processes data; on the other hand, it
makes the processed data available on the Web through a query builder
mechanism. As for analyzing repetitions, a system to identify repeated
nucleotide and amino acid patterns in specific sequences was proposed and
developed, particularly applied to orthologous genes.
The solutions found were later validated through case studies which
attested the value of the contribution this work has made
Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.