258 research outputs found

    Análise e compressão de sequências genómicas

    Get PDF
    Tese de doutoramento em InformáticaA informação dos códigos genéticos sequenciados é na actualidade, provavelmente, a fonte mais inspiradora para o estudo e avanço das teorias da informação e da codificação. Algoritmos eficientes para a sua compressão antevêm-se essenciais para a optimização do armazenamento e comunicação da informação genómica. A compressão de informação genómica é um caso particular da compressão de informação. A entropia das sequências de ADN é elevada, contudo variável. Ao nível intra-genómico é maior nas regiões codificantes e menor nas regiões não codificantes. Ao nível inter-genómico é maior nos seres procarióticos e menor nos eucarióticos. Na base da redução da entropia estão as regularidades que perfazem as regiões repetitivas do ADN. As regiões repetitivas compõem-se sobretudo de padrões aproximados, que incluem pontualmente mutações, delecções, inserções ou gaps. Os padrões exactos são menos relevantes e geralmente apresentam-se em numerosas repetições adjacentes. A redundância do ADN também tem manifestações estatísticas e probabilísticas. As redundâncias das sequências de ADN são a fonte de recursos de compressão, as grandes repetições indicam-se para a compressão substitucional com recurso a dicionário, enquanto que as evidências estatísticas e probabilísticas permitem modelar e predizer parcialmente a sucessão de símbolos (bases), utilizando compressores estatísticos para capitalizar esse potencial de compressão. Considerando a entropia máxima para o ADN, a sua codificação corresponde a 2 bits por base. Em média, os melhores compressores disponíveis, concebidos para a especificidade do ADN, alcançam os 1,7 bits/base, o que corresponde a uma taxa de compressão de apenas 15%, valor que é demonstrativo da dificuldade inerente. O trabalho realizado corresponde a um framework de análise e compressão de sequências de ADN, cuja aplicação principal corresponde ao DNALight. O DNALight é uma solução híbrida para compressão de informação genómica baseada na cooperação de várias metodologias vocacionadas para absorver ocorrências das diferentes tipologias de redundâncias presentes nas cadeias de nucleótidos. De facto, a compressão não é possível sem análise. É na completa análise que reside a obtenção dos recursos que permitirão reduzir a entropia. Para a análise de sequências de ADN desenvolveram-se algoritmos inovadores para a pesquisa de padrões exactos (GRASPm) e aproximados (SimSearch) que alcançam desempenhos que superam destacadamente o estado da arte. Estes algoritmos intervêm na primeira fase do DNALight que aproveita o potencial dos padrões mais representativos para a compressão substitucional baseada em dicionário de padrões exactos e aproximados. Para maximizar as captações de padrões, a pesquisa é exaustiva e efectuada multi-nível, ou seja, na sequência normal 5’-3’, na complementar natural 3’-5’, e também nas duas restantes complementares artificiais. Na segunda fase do DNALight, que procura fazer o aproveitamento das redundâncias desconsideradas pela captação da primeira fase, são construídos modelos probabilísticos de linguagem compactos com bases nas regiões menos repetitivas que transitam para esta fase, e que constituem o input para esta metodologia complementar. Em concorrência, os modelos geram predições sustentadas nas apreciações probabilísticas de modelos de linguagem globais e locais. As predições acertadas ou aproximadas permitem codificações mais económicas pois criam maior desequilíbrio no modelo probabilístico de codificação, beneficiando o desempenho da codificação aritmética que encerra o processo. O processo de descompressão é similar mas reverso ao descrito para a compressão. Os resultados experimentais colocam o DNALight como novo integrante do estado da arte em compressão de sequências de ADN, superando consistentemente, mas em pequena escala, os seus antecessores.Genetics is nowadays, probably, the most inspiring source for coding theory study and developments. Efficient compression algorithms are essential to optimise genomic data storage and communication. Genomic data compression is a particular case of data compression. The entropy present in DNA sequences is high, however variable. At intra-genomic level, it is higher in coding regions and lower in non-coding regions. At inter-genomic level, it is higher in the prokaryotes and lower in eukaryotes. DNA entropy reduction is achieved by coding more efficiently the repetitive regions of the ADN. Repetitive regions are mainly composed of inexact patterns. Patterns’ errors are caused by biological processes and DNA dynamics including mutations, deletions, insertions or gaps. Exact patterns are less relevant and generally are presented in tandem repetitions. DNA redundancies have also statistical and probabilistic manifestations. The redundancies of DNA sequences are the most proficuous source of compression resources, the larger repetitions are indicated for substitucional compression based on a dictionary, whereas the statistical and probabilistic evidences allow to model and predict the succession of symbols (bases) in the sequence, using statistical compression to capitalize this compression potential. Considering the maximum DNA entropy, its codification cost corresponds to 2 bits per base. On average, the best available compressors, conceived accordingly DNA data specificities, reach 1,7 bits/base, which corresponds to a compression rate of only 15%, and this value is demonstrative of the inherent difficulty. The developed work corresponds to a framework for the analysis and compression of DNA sequences, being DNALight the most representative application. DNALight is a hybrid solution for DNA compression based on the cooperative integration of complementary methodologies to absorb the different redundancies present in DNA sequences. In fact, compression is not possible without analysis. Gathering resources for compression relies mostly in analysis, and the emerged recurrences will allow to reduce the entropy. Innovative algorithms were developed for exact pattern-matching (GRASPm) and approximate and exact pattern discovery (SimSearch) and their performance notoriously surpasses the state of the art. These algorithms play an important role in the first phase of the DNALight to implement substitucional compression based on dictionary of exact and approximated repeats. To maximize pattern recollection, the searching is performed multi-level, i.e., in normal sequence 5' - 3', in natural complementary sequence 3' - 5', and also in the two remaining artificial complementary sequences. In the second phase of DNALight, focused on taking advantage of the missed redundancies in the first phase, probabilistic language models are built based on the less repetitive regions as they constitute the input of this complementary methodology. In competition, the models generate predictions supported in the probabilistic analysis of global and local language models. Accurate or approximated predictions allow compact codifications as they provide a more disproportional probabilistic model for codification, benefiting the arithmetic coding performance that encloses the process. The decompression process is similar, but reverse when compared with compression. The experimental results place DNALight as a new constituent of the state of the art in DNA sequences compression, surpassing consistently, but in small scale, its predecessors.Programa de Desenvolvimento Educativo para Portugal (PRODEP

    Study of dyslexia candidates genes in brazilian individuals

    Get PDF
    Orientador: Edi Lúcia SartoratoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de BiologiaResumo: A dislexia é definida como um distúrbio, ou transtorno de aprendizagem na área da leitura, escrita e soletração, que ocorre apesar de uma adequada inteligência e oportunidade sociocultural. A etiologia desse distúrbio se deve, em parte, a um importante componente genético. Ao todo, nove loci no genoma foram identificados por meio de estudos de ligação, e sete genes proeminentes foram propostos como candidatos à dislexia: DYX1C1, KIAA0319, DCDC2, ROBO1, MRPL19, C2ORF3 e KIAA0319L, mas nenhuma mutação funcional nesses genes foi efetivamente relacionada com a causa do distúrbio até o momento. O objetivo deste estudo foi verificar a relação de dados moleculares com a manifestação do distúrbio em 49 famílias de escolares brasileiros com diagnóstico de dislexia. Para isso, foi investigada a presença de grandes deleções e duplicações em algumas regiões dos genes candidatos DCDC2, KIAA0319 e ROBO1 pela técnica de Multiplex Ligation-dependent Probe Amplification (MLPA), utilizando o kit SALSA MLPA P150 (MRC-Holland, Amsterdam, The Netherlands). E além disso, foi realizado um estudo de associação utilizando 4 SNPs (Single Nucleotyde polymorphisms) presentes no gene DYX1C1, que já haviam sido relacionados com o fenótipo na literatura. A técnica de MLPA foi aplicada pela primeira vez na pesquisa de mutações em genes candidatos para a dislexia, este método foi reprodutível e o padrão de variação total por sonda foi baixo, porém a análise não revelou nenhuma deleção ou duplicação nas regiões de ligação das sondas nos genes estudados. Algumas modificações no kit de dislexia P150 foram sugeridas ao fabricante visando o aprimoramento para estudos futuros. Na etapa seguinte, a genotipagem dos SNPs foi realizada por PCR em tempo real, e a estratégia utilizada no estudo de associação foi o Teste de Transmissão de Desequilíbrio de Ligação (TDT). Nenhuma associação foi obtida para os marcadores estudados. As aparentes discrepâncias de nossos resultados com estudos anteriores podem ser explicados pelas diferenças na definição do fenótipo, a ancestralidade da amostra, o desenho do estudo, e as interações com efeitos ambientais que diferem entre populações. Esse resultado não descarta a participação do gene DYX1C1 na etiologia da dislexia, o aumento do número da amostra e de marcadores para estudos posteriores é fundamental para que se possa fazer uma análise mais completa do envolvimento desse gene no fenótipo, o que poderá fornecer importantes informações para o entendimento da dislexia e para futuros protocolos de diagnósticos e de conduta para os indivíduos afetadosAbstract: Dyslexia or reading disability is a learning disorder associated with difficulty in learning to read, writing and spelling, despite adequate intelligence and educational opportunities, with a significant heritable trait. At least nine loci in the genome were related through linkage studies, and seven prominent genes were associated with dyslexia: DYX1C1, KIAA0319, DCDC2, ROBO1, MRPL19, C2ORF3 and KIAA0319L but no functional mutation in these genes was indeed related with the disorder cause so far. The intent of this study was access the contribution of these genes in the learning disorder molecular etiology, in a sample 49 families of dyslexic Brazilian individuals. Large deletions and duplications in the candidate genes DCDC2, KIAA0319 and ROBO1 were investigated by Multiplex Ligation-dependent Probe Amplification (MLPA) technique, using the SALSA MLPA P150 kit (MRC-Holland, Amsterdam, The Netherlands). In addition, an association study was performed using 4 SNPs (Single Nucleotyde polymorphisms) in DYX1C1 gene, which had already related to the phenotype in the literature. The MLPA technique was applied for the first time in the search for candidate genes mutations in dyslexia, this method was reproducible and the overall standard variation per probe was low, but the analysis revealed no deletion or duplication in probes binding regions in the studied genes. Some modifications in the SALSA MLPA P150 kit have been suggested to the manufacturer attempting to improve it for future studies. In the next stage, SNPs genotyping was performed by real time PCR, and the strategy used in the association study was the Transmission Disequilibrium Test (TDT). No association was obtained for the markers. The apparent discrepancies of our results with previous studies can be explained by phenotype definition differences, the sample ancestry, study design, and interactions with environmental effects that differ between populations. This result does not rule out the involvement of DYX1C1 gene in the dyslexia etiology, the increase of the sample and markers numbers for future studies is essential to make a more complete analysis of this gene involvement in phenotype, which may provide important information to the dyslexia understanding and future diagnostic protocols and conduct for affected individualsMestradoGenetica Animal e EvoluçãoMestre em Genética e Biologia Molecula

    Presença da proteína p53 em carcinomas epidermóides de cabeça e pescoço: correlação histopatológica e implicação prognóstica em 31 casos

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Saúde. Programa de Pós-Graduação em Ciências MédicasIntrodução: A mutação do gene p53 é a alteração genética mais freqüentemente detectada em tumores de cabeça e pescoço, sendo fundamental em sua carcinogênese. Porém, o significado clínico e a correlação histopatológica desta alteração ainda não foram elucidados. Objetivos: Estudar a taxa de expressão da proteína p53 no serviço de Oncologia do Hospital Municipal São José de Joinville/SC e seu significado pprognóstico e correlação histopatológica. Método: Realizou-se, em 31 casos de tumores da região de cabeça e pescoço , um estudo tipo corte retrospectivo, enter agosto de 1996 e agosto de 1997, do serviço de Oncologia do Hospital Municipal de São José de Joinville/SC. A mutação do gene p53 foi pesquisada através da expressão da proteína p53 por imunohistoquímica em carcinomas epidermpoides de cabeça e pescoço. Resultados: A expressão da proteína p53 foi encontrada em 74,2% dos casos. Utilizando-se o teste exato de Fischer não se detectou correlação entre a presença de p53 e a graduação histopatológica (WHO), com p>0,05. Considerando-se os pacientes em estádio III e IV, a sobrevida global média do grupo p53 positivo foi de 11,87 meses, já nos pacientes p53 negativo foi de 30,24 meses, diferença estatisticamente significativa, com p>0,005. A sobrevida média em 02 anos também foi melhor em pacientes p53 negativos (57,1%) vs 6,25%), com valor de p=0,006. Conclusão: A taxa da expressão de p53 neste estudo de 74,2%, sem estabelecer-se correlação entre a presença da proteína p53 e a gradução histopatológica. A expressão da proteína p53 em carcinomas epidermóides de cabeça e pescoço parece influenciar a sobrevida global, porém estudos com maior número de casos e controle de variáveis como graduação histopatológica e modalidades de tratamento são necessários

    Evolução da produção de leite em pequenos ruminantes: polimorfismos do gene da hormona de crescimento

    Get PDF
    Os efetivos autóctones de pequenos ruminantes têm vindo a diminuir,em parte devido ao seu baixo potencial produtivo. A necessidade de encontrar formas mais expeditas de aumentar o potencial produtivo das nossas raças, e assim promover a sua manutenção bem como a sustentabilidade dos sistemas extensivos onde são explorados, levou à procura de marcadores moleculares, nomeadamente no gene da hormona de crescimento (GH), associados com a produção e qualidade do leite em pequenos ruminantes. Nas raças ovinas Churra da Terra Quente, Merino da Beira Baixa, Saloia e Serra da Estrela e caprinas Algarvia e Serrana verificou -se que o gene da GH é muito polimórfico, tendo sido encontrados polimorfismos específicos em algumas das raças. Os resultados sugerem que os polimorfismos do gene da GH, entre outros (e.g., nas caseínas), poderão vir a ser utilizados na seleção assistida por marcadores genéticos, de modo a melhorar da produção de leite sem afetar a sua qualidade. Contudo, a resposta à seleção será sempre condicionada pela prática de um correto maneio alimentar dos animais

    Sila Eukaryotic : ferramenta para anotação automática de genes eucariotos

    Get PDF
    Orientador : Prof. Dr. Roberto Tadeu RaittzCoorientador : Prof. Dr. Vinicius WeissDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 30/09/2016Inclui referências : f. 58-62Resumo: A marcação e anotação de genomas são processos essenciais e fundamentais presentes na Bioinformática, necessários para a análise de sequências de DNA. Geralmente essas atividades exigem muito tempo de processamento e alto custo computacional, encarecendo o processo nos muitos projetos distintos ao qual estão presentes. Tais atividades consistem basicamente em comparar sequências de DNA com grandes bancos de dados, este contendo entre milhares e milhões de registros. Considerando a necessidade de melhoramento dessas atividades fundamentais nas pesquisas que envolvem a Biologia Molecular, consequentemente a Bioinformática, este trabalho apresenta um programa de computador, chamado Sila Eukariotic, implementado para a anotação automática de sequências de DNA provenientes de organismos eucarióticos, utilizando busca e comparação de similaridades entre sequências de proteínas. O Sila Eukariotic utiliza ferramenta para predição e marcação de genes (GeneMark-ES) em conjunto com uma ferramenta de buscas de sequências de proteínas em banco de dados (RAFTS3), sendo a predição opcional ao usuário, cabendo também a opção pelo banco de dados de comparação a ser utilizado (NR, SwissProt e outros em formato multi-fasta). Os resultados evidenciaram melhoras na anotação de genes eucarióticos com baixíssimo custo e tempo de processamento comparado a outros buscadores disponíveis. O pacote está disponível para download e poderá ser executado em computadores com relativamente poucos recursos de hardware. Palavras-chave: Anotação automática de genomas eucarióticos, Comparação de sequências, Alignment-free.Abstract: The genome annotations are important and essential processes present on Bioinformatics, necessary to analyse DNA's sequences. Usually these activities need a lot of processing time and have high computational costs, making the projects, which are present, remain expensives. These activities consisti, basically, in comparing DNA's sequences against big data banks, that contain between thousands to milions of records. Seeing the need to improve these activities, this work presents a computer's system, called Sila Eukaryotic, implemented to make the automatic annotation for sequences of eukaryotics organisms, using search and comparison of similarity between proteins sequences. Sila Eukaryotics uses a tool for gene prediction (GeneMark-ES) together with a search proteins tool (RAFTS3) at a biological data bank. The prediction is optional, as the data bank to be used (NR, SwissProt e others on fasta file format). The results showed improvements in annotation, quickly and low computational costs. This package is avaliable to download and can be executed in computers with few hardware resources. Key-words: Automated eukaryotic genome annotation, Sequence comparison, Alignmentfree

    Proposta de uma estratégia para investigação molecular em pacientes brasileiros com anemia de Fanconi

    Get PDF
    Orientador: Prof. Dr. Ricardo PasquiniCo-orientadora: Drª. Noemi Farah PereiraTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências da Saúde, Programa de Pós-Graduação em Medicina Interna. Defesa : Curitiba, 07/10/2014Inclui referênciasResumo: Anemia de Fanconi (AF) é uma doença autossômica recessiva e, em raros casos, ligada ao X, com grande heterogeneidade genética resultante de diferentes mutações em genes cujos produtos estão envolvidos nas vias de reparo do DNA, sendo que 16 subtipos genéticos já foram identificados. A variabilidade fenotípica desta doença dificulta o diagnóstico clínico, sendo necessários testes laboratoriais para sua confirmação. A possível influência do genótipo AF nas manifestações clínicas, como falência progressiva da medula óssea, leucemias e câncer, pode ser melhor definida se a mutação dentro de um subtipo genético for identificada. A pesquisa de mutações é complexa em função do número de genes associados e da variedade de alterações deletérias e não deletérias em cada gene. Os objetivos deste estudo foram identificar o subtipo genético dos pacientes brasileiros com AF, desenvolver uma estratégia de diagnóstico molecular aplicável à rotina clínica e correlacionar os genótipos encontrados com os fenótipos observados. Foram incluídos 255 pacientes AF, atendidos no ambulatório de Anemia de Fanconi do HC/UFPR, entre 1995 e 2012. Foi desenvolvido um teste de triagem para a identificação de 11 mutações frequentes nos genes FANCA, FANCC e FANCG dos pacientes AF brasileiros. Nos casos identificados somente em heterozigose a segunda mutação envolvida foi investigada pela técnica de MLPA (Multiplex Ligation Probe Amplification) e (ou) sequenciamento do DNA. Utilizando o teste de triagem proposto foi possível identificar alterações em 128 dos 255 pacientes (50,2%). Foram encontradas mutações no FANCA em 89/255 pacientes, no FANCC em 11/255 e no FANCG em 28/255. Em 71/128 pacientes foram encontradas mutações em homozigose e em 57/128 em heterozigose composta. Em quatro destes 57 a segunda mutação foi identificada ainda na triagem, em 51/57 foi necessário utilizar o MLPA e sequenciamento, e em dois pacientes não foi identificada a segunda mutação. Um total de 52 mutações diferentes foi encontrado, sendo 22 novas alterações ainda não descritas na literatura. O método proposto foi eficiente, pois permitiu a subtipificação genética de 126/255 (49,4%) pacientes. O uso desta estratégia possibilitou diminuir em 29,4% a necessidade do sequenciamento, além de dirigi-lo para um único gene em 20,0% dos casos heterozigotos. A redução do custo e do tempo torna viável a pesquisa de mutações como ferramenta para diagnóstico molecular da AF entre brasileiros. A análise da associação das mutações c.3788-3790delTCT e c.1077-2A>G com o fenótipo e às manifestações clínicas se restringiu aos dados disponíveis, porém foi limitada pelas dificuldades inerentes ao conteúdo dos prontuários. O uso desta estratégia de tipificação molecular em um maior número de pacientes permitirá a investigação mais ampla do efeito destas mutações na evolução clínica da AF. Palavras-chave: Anemia de Fanconi. Mutação-genética. Genes AF.Abstract: Fanconi Anemia (FA) is an autosomal recessive or X-linked disease, with wide genetic heterogeneity resulting from different mutations in genes which products are involved in DNA repair pathways and 16 genetic subtypes have been identified. The phenotypic variability makes clinical diagnosis difficult and laboratory tests are necessary for confirmation. The possible influence of genotype in clinical manifestations such as progressive bone marrow failure, leukemia and cancer may be better understood if the mutations within a genetic subtype are identified. The mutation's investigation is complex due to the number of associated genes and the variety of deleterious and non-deleterious mutations in each gene. The aims of this study were to identify genetic subtypes of Brazilian patients with FA, to develop a strategy for molecular diagnosis applicable to clinical routine, and to correlate genotypes with phenotypes. 255 patients from Fanconi Anemia Outpatient Clinic of HC/UFPR, from 1995 to 2012 were included. The initial strategy was a screening test which included eleven frequent mutations in FA Brazilian patients. In the heterozygous cases the second mutation was investigated by MLPA (Multiplex Ligation Probe Amplification), and/or DNA sequencing. Using the proposed screening test, mutations were identified in 128 out of 255 patients (50.2%). FANCA mutations were found in 89/255 patients, FANCC in 11/255 patients and FANCG in 28/255 patients. 71/128 patients showed homozygous mutations and 57/128 were found in heterozygosis. In four out of 57 heterozygous the second mutation was identified in the screening test, in 51/57 MLPA and sequencing were required. In two patients the second mutation involved was not identified. A total of 52 different mutations were found, 22 of them are new mutations not previously described. The proposed method was effective because it allowed the genetic subtyping of 126/255 (49.4%) patients. Using this strategy a 29.4% decrease in sequencing demand was observed as well as sequencing was driven to a single gene in 20.0% when heterozygous. Cost and time reduction makes it feasible to search for mutations as a tool for molecular diagnosis of FA Brazilian patients. Analysis of association of the mutations c.3788_3790delTCT and c.1077-2A> G with the phenotype and the clinical manifestations was restricted to the available data, but limited by the difficulties relative to the content of the medical records. The use of this molecular typing strategy in a larger number of patients will allow more extensive investigation of the effect of these mutations in the clinical evolution of FA. Keywords: Fanconi Anemia. Genetic Mutation. FA genes

    Bioinformatic studies on structural elements for the regulation of alternative oxidase (AOX) gene activities

    Get PDF
    Trabalho de projecto de mestrado em Engenharia Informática, apresentado à Universidade de Lisboa, através da Faculdade de Ciências, 2007Alternative Oxidase genes encode a small family of isoenzymes (enzymes with some differences but act in the same chemical reaction). AOX is present in plants, fungi, algae, some yeast, and was also found in some classes of the animal kingdom. The enzymes are responsible for an alternative pathway of respiration that is responsive to stress conditions but also to pathogen attack, as well as growth and stage development. Scaffold Matrix Attachment Regions (S/MARs) are DNA sequences from 300 to 3000 nucleotides that bound with nuclear proteins serving as anchors for DNA, influencing in this way the DNA organization inside the cell. Several studies have failed to reveal a pattern of organization in the sequences, however some rules have been found that help computer based analysis. Experimental identification of these sequences is hard and time consuming, computer methods could provide a first step selection, and cover larger sequences. In order to highlight possible links between S/MARs and differential regulation of AOX genes, the first part of this project consists in identifying structurally relevant S/MAR regions in the neighborhood of AOX genes in Arabidopsis thaliana and in rice using a selected computer program. Single Nucleotide Polymorphisms (SNPs) are variations in one nucleotide base among DNA sequences from the same location, from different individuals. These differences could serve as markers to classify a specific set of individuals. The second part of this project consists in the development of a bioinformatic application that will help in the identification of specific polymorphisms (SNPs) in sequences that are experimentally obtained at the EU Marie Curie Chair in ICAM University of Évora, where this project is performed.Os genes da oxidase alternativa (ou AOX) codificam uma pequena família de isoenzimas (enzimas com algumas diferenças mas que actuam nas mesmas reacções químicas), que se encontram nas plantas, fungos, algas, algumas leveduras bem como em algumas classes do reino animal. A AOX é responsável por uma via alternativa de respiração, activada principalmente em condições de stress mas também como reacção a ataques patogénicos, bem como em estádios específicos do desenvolvimento da planta. As Scaffold Matrix Attachment Regions (S/MARs) são sequências de DNA entre 300 e 3000 nucleótidos que se ligam a proteínas do núcleo da célula, servindo como âncoras para o DNA, conferindo-lhe assim uma forma própria no interior da célula. Estudos realizados para determinar uma organização específica destas regiões não produziram muitos resultados, no entanto foram definidas algumas regras que permitem ajudar na detecção computacional destas sequências, uma vez que a detecção experimental é difícil e morosa. Com vista a estabelecer possíveis relações entre uma regulação diferenciada dos genes da AOX através dos S/MARs, a primeira parte deste projecto consiste em determinar as regiões do DNA com a estrutura de potenciais S/MARs na vizinhança dos genes da Oxidase Alternativa na Arabidopsis thaliana e no arroz. Single Nucleotide Polymorphisms (SNPs) são diferenças de um nucleótido entreas mesmas regiões de DNA de diferentes indivíduos da mesma espécie. Estas diferençaspodem servir para marcar um determinado conjunto de indivíduos.A segunda parte deste projecto consiste em desenvolver uma aplicação para ajudarna identificação de tipos específicos de polimorfismos, (SNPs) em sequências identificadas na EU Marie Curie Chair, ICAM, Universidade de Évora, onde este projecto foi desenvolvido

    Associação da gravidade clínica da fibrose cística com variantes na família de genes SLC (SLC26A9, SLC9A3, SLC6A14 e SLC11A1)

    Get PDF
    Orientadores: Carmen Sílvia Bertuzzo, Fernando Augusto de Lima MarsonDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências MédicasResumo: Introdução: A fibrose cística (FC) se manifesta com variabilidade clínica e anatomopatológica que dependem de fatores ambientais e genéticos. Os genes que codificam canais iônicos têm sido pouco estudados. Objetivo: Associar variantes nos genes da família SLC [rs3788766 (SLC6A14), rs7512462 (SLC26A9), rs17235416 (SLC11A1) e rs17563161 (SLC9A3)] com 43 marcadores de gravidade da FC. Métodos: As variantes foram identificadas por PCR em tempo real em 188 pacientes com FC considerando o genótipo do gene CFTR. A análise estatística foi realizada por testes paramétricos e não paramétricos, considerando a distribuição dos dados em categóricos e numéricos. Além disso, avaliamos a interação gênica e sua associação com a gravidade clínica pela ferramenta Multifactor dimensionality reduction. A correção por múltiplos testes foi realizada pelo False Rate Discovery test. Alpha=0,05. Resultados: Dependendo das mutações no gene CFTR, encontramos associação de: (i) rs3788766*CC com Pseudomonas aeruginosa mucoide (OR= 0,171; IC95%= 0,029 a 0,696), P. aeruginosa não mucoide (OR= 0,283; IC95%= 0,094 a 0,853) e Staphyloccocus aureus (OR= 4,443; IC95%= 1,019 a 40,64), maior FEFmax (p= 0,041) e melhor resposta ao broncodilatador para FEF50% (p= 0,033) e VEF1/CVF (p= 0,044); (ii) rs3788766*CT com inicio precoce dos sintomas pulmonares (OR= 3,524; IC95%= 1,229 a 10,1) e prevalência de osteoporose (OR= 0,203; IC95%= 0,022 a 0,883); (iii) rs3788766*TT com menor índice de massa corpórea (OR= 4,242; IC95%= 1,505 a 11,95), presença de P. aeruginosa mucoide (OR= 3,176; IC95%= 1,29 a 7,819) e S. aureus (OR= 0,116; IC95%= 0,004 a 0,881), maior escore de Bhalla (p= 0,047) e menores valores de FEFmax (p= 0,028) e FEF25% (p= 0,031); (iv) rs7512462*CC com maiores valores do escore de Shwachman-Kulczycki (p= 0,019), CVF (p= 0,043), VEF1 (p= 0,047), VEF1/CVF (p= 0,022), FEF50% (p= 0,038) e FEF25-75% (p= 0,016); (v) rs7512462*CT com menores valores de CVF (p=0,034), VEF1 (p= 0,047), VEF1/CVF (p= 0,022), FEF25% (p= 0,012), FEF50% (p= 0,038), FEF75% (p= 0,008), FEF25-75% (p=0,016) e VRE (p= 0,023); (vi) rs7512462*TT com melhor resposta ao broncodilatador inalatório para VEF1 (p= 0,011), FEF50% (p= 0,019), FEF75% (p= 0,036) e FEF25-75% (p= 0,008); (vii) rs17235416*Normal com menor valor de SaO2 (p= 0,010) e maior prevalência de S. aureus (OR= 3,333; IC95%= 1,085 a 10,24); (viii) rs17563161*GG com menor idade para inicio dos sintomas digestivos (OR= 2,564; IC95%= 1,234-5,33). Finalmente, houve interação positiva das variantes e mutações de CFTR com: (i) sexo do paciente (p< 0.001); (ii) presença de insuficiência pancreática (p= 0.006); (iii) P. aeruginosa mucoide (p= 0.05). Conclusão: Na amostra avaliada, a variabilidade clínica e laboratorial da FC foi associada ao genótipo das variantes rs3788766, rs7512462, rs17235416 e rs17563161. Além disso, observamos interação gênica entre as variantes avaliadas, genótipo de CFTR e marcadores clínicos da FCAbstract: Introduction: The cystic fibrosis (CF) manifests with clinical and anatomopathological variability who depending on environmental and genetic factors. Genes that encode ion channels have few published studies. Objective: To associate the variants in the genes that encode ion channels [rs3788766 (SLC6A14), rs7512462 (SLC26A9), rs17235416 (SLC11A1) e rs17563161 (SLC9A3)] with 43 severity markers from CF diasease. Methods: The genetic variants were dentified by real-time PCR in 188 patients with CF considering the CFTR mutation. Statistical analysis was performed by parametric and non-parametric tests, considering the distribution of the data in categorical and numerical. Moreover, we evaluated the genetic interaction and its association with clinical severity by the Multifactor dimensionality reduction tool. The correction by multiple tests was performed by the False Rate Discovery test. Alpha= 0.05. Results: According on mutations in the CFTR gene, we found association of: (i) rs3788766*CC with mucoid Pseudomonas aeruginosa (OR= 0.171; 95%CI= 0.029 to 0.696), non-mucoid P. aeruginosa (OR= 0.283; 95%CI= 0.094 to 0.853) and Staphyloccocus aureus (OR= 4.443; 95%CI= 1.019 to 40.64), higher values for FEFmax (p= 0.041) and better bronchodilator response for FEF50% (p= 0.033) and FEV1/FVC (p= 0.044); (ii) rs3788766*CT with early onset of pulmonary symptoms (OR= 3.524; 95%CI= 1.229 to 10.1) and osteoporosis prevalence (OR= 0.203; 95%CI= 0.022 to 0.883); (iii) rs3788766*TT with lower body mass index (OR= 4.242; 95%CI= 1.505 to 11.95), presence of mucoid P. aeruginosa (OR= 3.176; 95%CI= 1.29 to 7.819) and S. aureus (OR= 0.116; 95%CI= 0.004 to 0.881), highest values for Bhalla score (p= 0.047) and lower values of FEFmax (p= 0.028) and FEF25% (p= 0.031); (iv) rs7512462*CC with highest values for Shwachman-Kulczycki score (p= 0.019), FVC (p= 0.043), FEV1 (p= 0.047), FEV1/FVC (p= 0.022), FEF50% (p= 0.038) and FEF25-75% (p= 0.016); (v) rs7512462*CT with lower values of FVC (p= 0.034), FEV1 (p= 0.047), FEV1/FVC (p= 0.022), FEF25% (p= 0.012), FEF50% (p= 0.038), FEF75% (p= 0.008), FEF25-75% (p= 0.016) and ERV (p= 0.023); (vi) rs7512462*TT with better bronchodilator response for FEV1 (p= 0.011), FEF50% (p= 0.019), FEF75% (p= 0.036) and FEF25-75% (p= 0.008); (vii) rs17235416*Normal with lower values of SaO2 (p= 0.010) and higher S. aureus prevalence (OR= 3.333; 95%CI=1.085 to 10.24); (viii) rs17563161*GG with lower age for digestive symptoms (OR= 2.564; 95%CI= 1.234 to 5.33). Finally, there was a positive interaction of variants and CFTR mutations with: (i) the patient's gender (p< 0.001); (ii) the presence of pancreatic insufficiency (p= 0.006); (iii) mucoid P. aeruginosa (p= 0.05).Conclusion: In this sample, the clinical and laboratory markers of CF severity were associated with the genotype of rs3788766, rs7512462, rs17235416 and rs17563161 variants. Moreover, we observed gene interaction between the variants evaluated, CFTR genotype and clinical markers of CFMestradoGenetica MedicaMestra em Ciência

    Post-transcriptional regulation of glutaminase enzyme by HuR and its relationship with high glutaminolytic levels in tumors

    Get PDF
    Orientador: Sandra Martha Gomes DiasTese (doutorado) - Universidade Estadual de Campinas, Instituto de BiologiaResumo: A anaplerose do ciclo do TCA por glutamina, uma importante fonte energética e biossintética para células em elevada divisão celular, é prejudicada pela inibição da glutaminase. A inibição da glutaminase por CB-839 está em teste clínico como tratamento de múltiplos tumores sólidos e hematológicos. HuR (Human antigen R) é uma proteína codificada pelo gene ELAVL1. HuR apresenta três domínios de ligação à RNA e liga a elementos ricos em AU, afetando a estabilidade e o splicing do RNA. Achados prévios relacionam HuR à estabilização do mRNA da isoforma de glutaminase chamada de glutaminase C (GAC) em acidose renal e seu ortólogo, HuD, ao splicing alternativo de GLS em células neuronais. Com base nisto, nós hipotetizamos que HuR seria um importante regulador de glutaminase em câncer. Inicialmente nós avaliamos dados de transcriptômica pan-câncer do TCGA e observamos que pacientes com alta expressão de ELAVL1 apresentam aumentado risco de recidiva tumoral, sendo que em câncer de mama observamos um Cox hazard ratio (HR) de 1,82. Além disto, utilizando dados públicos de RNA-Seq, RIP-Seq e PAR-CLIP-Seq nós mostramos que HuR liga ao intron 14 de GLS e controla seu splicing, levando à escolha da isoforma kidney-type glutaminase (KGA) frente à GAC. Em adição, empregando células de câncer de mama e próstata e HEK293 (com um knock-in produzido por CRISPR/Cas9 onde foi inserido gene para proteína fluorescente no C-terminal de KGA) nós confirmamos que HuR aumenta os níveis de KGA por afetar o splicing e a estabilidade do mRNA. O silenciamento lentiviral de ELAVL1 prejudicou a proliferação, migração, invasão e aumentou o vício em glutamina de células de câncer de mama in vitro. O tratamento de células de câncer de mama silenciadas para ELAVL1 com CB-839 teve efeito sinérgico no sentido de afetar proliferação e invasão celulares in vitro. Nós propomos HuR como um fator de prognóstico em câncer de mama, com impacto especialmente no metabolismo de glutamina através da regulação de splicing do gene GLS. Nesta tese, nós também apresentamos em anexo sete artigos publicados que participei como co-autor, sendo quatro em co-primeira autoriaAbstract: TCA cycle anaplerosis by glutamine, an important energetic and biosynthetic source for rapidly dividing cells, is impaired by glutaminase inhibition. Glutaminase inhibition by CB-839 is currently under clinical trials for treating multiple solid and haematological tumors. HuR (Human antigen R) is a protein encoded by the ELAVL1 gene. HuR contains three RNA-binding domains and binds cis-acting AU-rich elements, affecting mRNA stability and splicing. Previous findings have linked HuR to GLS mRNA stabilization in renal acidosis, and its ortholog, HuD, to GLS splicing in neuronal cells. We then hypothesized that HuR was an important glutaminase regulator in cancer. We first inquired a TCGA pan-cancer cohort and found that patients with higher ELAVL1 expression had increased risk of tumor recidive (Cox HR of 1.82 for breast cancer). Moreover, by using publicly available RNA-Seq, RIP-Seq and PAR-CLIP-Seq data we showed that HuR binds to GLS intron 14 and controls GLS splicing, leading to kidney type glutaminase (KGA) choice over glutaminase C (GAC). Using breast and prostate cancer and HEK293 (with a CRISPR/Cas9 knock in) cell lines we further confirmed that HuR increases KGA by affecting splicing and mRNA stability. Lentiviral ELAVL1 silencing impaired breast cancer cell¿s proliferation, migration, invasion and increased glutamine addiction in vitro. Treating silenced ELAVL1 breast cancer cells with CB839 further impaired proliferation and invasion. We proposed HuR as a prognostic factor in breast cancer, with special impact on glutamine metabolism through splicing regulation. In this thesis, we also present seven published articles on which I participated as a co-author, being four as co-first authorDoutoradoGenetica Animal e EvoluçãoDoutor em Genetica e Biologia Molecular2014/17820-3FAPES

    RNAs n?o codificadores longos em Schistosoma mansoni : predi??o e perfil de express?o diferencial no est?gio evolutivo de verme adulto.

    Get PDF
    Programa de P?s-Gradua??o em Biotecnologia. N?cleo de Pesquisas em Ci?ncias Biol?gicas, Pr?-Reitoria de Pesquisa de P?s Gradua??o, Universidade Federal de Ouro Preto.A esquistossomose ? considerada uma doen?a debilitante de grande impacto socioecon?mico no mundo causada por platelmintos do g?nero Schistosoma. Uma das principais esp?cies identificadas nesse g?nero ? o parasita Schistosoma mansoni, que apresenta um ciclo de vida bastante complexo. Acredita-se que a complexidade dos programas de diferencia??o e desenvolvimento observado entre os diferentes est?gios evolutivos e ambientes onde o parasita vive seja dependente da regula??o da express?o g?nica. Os RNAs n?o codificantes representam uma das principais classes de mol?culas que potencialmente controlam a regula??o g?nica nos n?veis: epigen?tico, transcricional, p?s-transcricional e traducional. Esses RNAs s?o divididos em dois grandes grupos, os RNAs pequenos n?o codificantes de prote?na e os RNAs longos n?o codificantes (lncRNAs), o foco desse projeto. Os lncRNAs correspondem aos transcritos com mais de 200 nucleot?deos e que n?o codificam prote?nas. Particularmente, est?o envolvidos em diversas fun??es regulat?rias celulares, como regular a transcri??o, induzir o remodelamento da cromatina e modifica??es em histonas, originar siRNAs end?genos, modular atividades de prote?nas, alterar a localiza??o celular de prote?nas, ser precursores de pequenos RNAs, entre outros. A hip?tese desse trabalho ? que o S. mansoni expresse um conjunto de lncRNAs de forma diferencial atrav?s da reprograma??o de sua express?o g?nica em determinados est?gios evolutivos. Para investig?-la foi utilizado um conjunto de dados de RNA-seq dispon?vel para a fase adulta do parasito objetivando: (i) a montagem de um pipeline para identificar e caracterizar lncRNAs a partir de dados de RNA-seq com alta confian?a; (ii) classificar os novos lncRNAs preditos utilizando a anota??o Gene Ontology; (iii) analisar a express?o de um conjunto de 20 lncRNAs em cerc?ria, esquistoss?mulos com 3,5h de cultivo in vitro, machos, f?meas, casal e ovos; (iv) analisar a express?o de lncRNAs em parasitos resistentes ao praziquantel e (v) analisar a express?o de lncRNAs em f?gado de camundongo infectado e n?o infectado com S. mansoni. Foram identificados 170 novos Sm-lncRNAs com termos de ontologia relacionados ao metabolismo, transporte e bioss?ntese. Quinze dos preditos lncRNAs mostraram express?o diferencial nos est?gios avaliados, bem como entre machos e f?meas. Alguns apresentaram express?o diferencial em parasitos com resist?ncia ao praziquantel e em f?gado de camundongos infectados. Esses achados abrem novas perspectivas para estudos funcionais focados em resist?ncia a essa droga e desenvolvimento de biomarcadores espec?ficos para a esquistossomose.Schistosomiasis is a debilitating disease of great socioeconomic impact in the world caused by flatworms of the genus Schistosoma. One of the main species identified in this genus is the parasite Schistosoma mansoni, which presents a very complex life cycle. The differentiation and development programs complexity observed among the different evolutionary stages and environments where the parasite lives depend on the gene expression. Non-coding RNAs represent one of the major classes of molecules that potentially control gene regulation at levels: epigenetic, transcriptional, post-transcriptional, and translational. These RNAs are divided into two large groups, the small non-coding RNAs and the long non-coding RNAs (lncRNAs), the focus of this study. The lncRNAs correspond to transcripts with more than 200 nucleotides and are not responsible for protein coding. In particular, they are involved in several cellular regulatory functions, such as regulating transcription, inducing chromatin remodeling and histone modifications, originating endogenous siRNAs, modulating protein activities, altering cell localization of proteins, being precursors of small RNAs and others functions. This study hypothesis is that S. mansoni expresses a set of lncRNAs differentially by reprogramming their gene expression at certain evolutionary stages. To investigate it, a set of available RNA-seq data was used for the adult phase of the parasite aiming at: (i) assembling a pipeline to identify and characterize lncRNAs from highly reliable RNA-seq data; (ii) classify the novel lncRNAs predicted using the Gene Ontology annotation; (iii) to analyze the expression of a set of 20 lncRNAs in cercariae, schistosomules with 3.5 h of in vitro culture, males, females, couple and eggs; (iv) to analyze the expression of lncRNAs in praziquantel resistant parasites and (v) to analyze the expression of lncRNAs in the liver of infected and uninfected S. mansoni mice. We identified 170 new Sm-lncRNAs with terms of ontology related to metabolism, transport and biosynthesis. Fifteen of them showed differential expression in the evaluated stages, as well as between males and females. Some showed differential expression in parasites with resistance to praziquantel and in liver of infected mice. These findings highlight new perspectives for functional studies focused on resistance to this drug and specific biomarkers development for schistosomiasis
    corecore