10 research outputs found

    SIMTar: a tool for prediction of SNPs interfering on microRNA target sites

    No full text
    Polimorfismos de um nucleotídeo (SNPs) podem alterar, além de códons de leitura da tradução de genes, posições genômicas importantes do processo de regulação gênica, como sítios de iniciação de transcrição, de splicing e, mais especificamente, sítios alvos de microRNAs (miRNAs). Em parti- cular, a identificação de SNPs alterando sítios alvos de miRNAs é um problema em aberto, embora venha ganhando um importante destaque nos últimos anos decorrente dos avanços descobertos sobre a capacidade dos miRNAs como elementos reguladores do genoma, associados inclusive a muitas doenças como o câncer e vários transtornos psiquiátricos. Os recursos computacionais atualmente disponíveis para esta finalidade (alguns bancos de dados e uma ferramenta) estão restritos à análise de SNPs na região 3UTR (UnTranslated Regions) de RNAs mensageiros, onde miRNAs geralmente se ligam para reprimir sua tradução. No entanto, essa é uma simplificação do problema, dado que já se conhece a regulação por miRNAs ativando ou reprimindo a transcrição gênica quando ligados à sua região promotora, aumentando a efetividade da regulação negativa da tradução quando ligados à região codificante do gene ou ainda miRNAs se ligando a RNAs não codificantes. Esses recursos se limitam também à identificação de SNPs na região seed dos sítios de miRNAs, e portanto só identificam criação ou ruptura de sítios. Porém, SNPs localizados fora dessa região não só podem colaborar na criação e ruptura de sítios como também interferir na estabilidade de ligação de miRNAs e, por- tanto, na efetividade da regulação. Além disso, considerando toda a extensão do sítio, não somente a seed , é possível ocorrer mais de um SNP e, sendo assim, a combinação desses SNPs pode ter uma influência ainda maior na ligação com o miRNA. Os recursos atuais também não informam quais alelos dos SNPs, muito menos quais combinações deles, estão causando qual efeito. Por fim, tais recursos estão restritos a Homo sapiens e Mus musculus. Assim, este trabalho apresenta a ferramenta computacional SIMTar (SNPs Interfering in MicroRNA Targets), desenvolvida para identificar SNPs que alteram sítios alvos de miRNAs e que preenche as lacunas mencionadas. Além disso, é descrita uma aplicação de SIMTar na análise de 114 SNPs associados à esquizofrenia, na qual todos foram preditos interferindo em sítios alvos de miRNAs.Single nucleotide polymorphisms (SNPs) can be involved in alteration of not only open reading frame but also important genomic positions of gene regulation process such as transcription initiation sites, splicing sites and microRNA target sites. In particular, the identification of SNPs interfering on microRNA target sites is still an open problem, despite its increasing prominence in recent years due to the discoveries about the microRNA abilities as regulatory elements in the genome and association with severals diseases such as cancer and psychiatric disorders. The computational resources currently available for this purpose (four databases and one tool) are restricted to the analysis of SNPs in the 3UTR (UnTranslated Regions) of mRNAs, where the microRNAs typically bind in order to repress their translation. However, this is a simplification of the problem, since it is already known the gene transcription activation by microRNAs bound to its promoter region, increasing of the effectiveness of negative regulation of translation when microRNAs are bound to the coding region of the gene or binding of microRNA into non-coding RNAs. These resources are also limited to the identification of SNPs in the seed region of miRNAs, and therefore they can only identify sites creation or disruption. However, SNPs located outside this region can not only create and disrupt target sites but also interfere on the stability of miRNAs binding and therefore on the regulation effectiveness. Moreover, considering the target site length, more than one SNP can occur inside of a site and thus, the combination of these SNPs can have an even greater influence on the microRNA binding. Also, current resources do not display which alleles of SNPs or what combinations of them are causing which effect. Finally, these features are restricted to the Homo sapiens and Mus musculus species. This work presents the computational tool SIMTar (SNPs Interfering on MicroRNA Targets), developed to identify SNPs that alter miRNA target sites and fills the mentioned gaps. Finally, it is described an application of SIMTar on the analysis of 114 SNPs associated with schizophrenia, all of them being predicted interfering with miRNA target sites

    Systems Integration Tool: an integration and visualization tool for big data and their application on sugarcane

    No full text
    As respostas das plantas ao ambiente são orquestradas por fatores genéticos, bem como sua flexibilidade metabólica, uma vez que essas são sésseis. As respostas das plantas ao ambiente são regidas por fatores genéticos, bem como sua flexibilidade metabólica, uma vez que essas são sésseis. A forma com que os padrões gênicos e metabólicos redundam entre as células, refletem nos diferentes níveis organizacionais (célula, tecido, órgão e até o organismo como um todo). Por isso, para entendermos as respostas das plantas em determinados estágios de desenvolvimento ou condições é importante explorarmos ao máximo os diferentes níveis de regulação. Neste sentido, tem crescido a quantidade de dados biológicos obtidos através de métodos que produzem dados em larga escala, visando um estudo de forma sistêmica. Embora existam várias ferramentas para a integração de dados biológicos, elas estão desenvolvidas para organismos modelos, inviabilizando análises para outros, como a cana-de-açúcar, que possui vários dados biológicos disponíveis, mas com genoma complexo e incompleto. Tendo em vista a importância econômica da cana-de-açúcar e o interesse em entendermos o processo de degradação da parede celular, desenvolvemos a ferramenta SIT (Systems Integration Tool), para integração dos dados disponíveis (transcritoma, proteoma e atividade enzimática). A implementação da ferramenta foi realizada utilizando as linguagens de programação Perl e Java. SIT possui uma interface gráfica, podendo ser executada localmente, a qual possibilita a integração de até seis diferentes conjuntos de dados. A visualização do resultado é obtida na forma de redes complexas, permitindo ao usuário a visualização e edição dinâmica da integração. O uso da SIT permitiu no presente estudo, entre outros, a identificação de elementos chave na degradação da parede celular, presentes nos diferentes conjuntos de dados explorados, apontando portanto, potenciais alvos de estudos experimentais. SIT pode ser aplicada à diferentes conjuntos de dados, a qual poderá auxiliar em estudos futuros em várias áreas do conhecimento.Plant are sessile organisms, and their responses to environmental stimuli are orchestrated by genetic factors, as well as by their metabolic flexibility. Inside the cell, there are genetic and metabolic patterns responsible for cell redundancy, and that reflects on different organizational levels (cell, tissue, organ, until a whole organism). Thus, to understand plant responses to certain conditions, it is important to understanding different regulatory levels. Recently, there was a large increase in availability of biological data. This happened due to the advance in next-generation sequencing techniques, which now enables more profound system biology studies. Despite the availability of several integration tools for analysis of biological data, these were developed for organism modeling. However, such tools are partially effective for sugarcane, for which there are large amounts of data, but has incomplete genome data. Due to the economic importance of sugarcane and aiming at understanding cell wall degradation process, we develop the software Systems Integration Tool (SIT). The tool integrates available data (transcriptomics, proteomics, and enzymatic activity). The implementation was performed in Perl and Java. SIT has a graphical interface, standalone execution, enabling integration until six layers of data. Integration results are generated as complex networks, allowing the users to visualize and dynamically edit the networks. The present study allowed the identification of key cell wall regulatory elements present on different data sets pointing out to potential targets for experimental validation. SIT can be applied to various data sets being capable of helping future studies in different areas of knowledge

    Systems Integration Tool: an integration and visualization tool for big data and their application on sugarcane

    No full text
    As respostas das plantas ao ambiente são orquestradas por fatores genéticos, bem como sua flexibilidade metabólica, uma vez que essas são sésseis. As respostas das plantas ao ambiente são regidas por fatores genéticos, bem como sua flexibilidade metabólica, uma vez que essas são sésseis. A forma com que os padrões gênicos e metabólicos redundam entre as células, refletem nos diferentes níveis organizacionais (célula, tecido, órgão e até o organismo como um todo). Por isso, para entendermos as respostas das plantas em determinados estágios de desenvolvimento ou condições é importante explorarmos ao máximo os diferentes níveis de regulação. Neste sentido, tem crescido a quantidade de dados biológicos obtidos através de métodos que produzem dados em larga escala, visando um estudo de forma sistêmica. Embora existam várias ferramentas para a integração de dados biológicos, elas estão desenvolvidas para organismos modelos, inviabilizando análises para outros, como a cana-de-açúcar, que possui vários dados biológicos disponíveis, mas com genoma complexo e incompleto. Tendo em vista a importância econômica da cana-de-açúcar e o interesse em entendermos o processo de degradação da parede celular, desenvolvemos a ferramenta SIT (Systems Integration Tool), para integração dos dados disponíveis (transcritoma, proteoma e atividade enzimática). A implementação da ferramenta foi realizada utilizando as linguagens de programação Perl e Java. SIT possui uma interface gráfica, podendo ser executada localmente, a qual possibilita a integração de até seis diferentes conjuntos de dados. A visualização do resultado é obtida na forma de redes complexas, permitindo ao usuário a visualização e edição dinâmica da integração. O uso da SIT permitiu no presente estudo, entre outros, a identificação de elementos chave na degradação da parede celular, presentes nos diferentes conjuntos de dados explorados, apontando portanto, potenciais alvos de estudos experimentais. SIT pode ser aplicada à diferentes conjuntos de dados, a qual poderá auxiliar em estudos futuros em várias áreas do conhecimento.Plant are sessile organisms, and their responses to environmental stimuli are orchestrated by genetic factors, as well as by their metabolic flexibility. Inside the cell, there are genetic and metabolic patterns responsible for cell redundancy, and that reflects on different organizational levels (cell, tissue, organ, until a whole organism). Thus, to understand plant responses to certain conditions, it is important to understanding different regulatory levels. Recently, there was a large increase in availability of biological data. This happened due to the advance in next-generation sequencing techniques, which now enables more profound system biology studies. Despite the availability of several integration tools for analysis of biological data, these were developed for organism modeling. However, such tools are partially effective for sugarcane, for which there are large amounts of data, but has incomplete genome data. Due to the economic importance of sugarcane and aiming at understanding cell wall degradation process, we develop the software Systems Integration Tool (SIT). The tool integrates available data (transcriptomics, proteomics, and enzymatic activity). The implementation was performed in Perl and Java. SIT has a graphical interface, standalone execution, enabling integration until six layers of data. Integration results are generated as complex networks, allowing the users to visualize and dynamically edit the networks. The present study allowed the identification of key cell wall regulatory elements present on different data sets pointing out to potential targets for experimental validation. SIT can be applied to various data sets being capable of helping future studies in different areas of knowledge

    MicroRNAs Discriminate Familial from Sporadic Non-BRCA1/2 Breast Carcinoma Arising in Patients ≤35 Years

    No full text
    <div><p>The influence of genetic factors may contribute to the poor prognosis of breast cancer (BC) at a very young age. However <i>BRCA1/2</i> mutations could not explain the majority of cases arising in these patients. MicroRNAs (miRs) have been implicated in biological processes associated with BC. Therefore, we investigated differences in miRs expression between tumors from young patients (≤35 years) with sporadic or familial history and non-carriers of <i>BRCA1/2</i> mutations. Thirty-six young Brazilian patients were divided into 2 groups: sporadic (NF-BC) or familial breast cancer (F-BC). Most of the samples were classified as luminal A and B and the frequency of subtypes did not differ between familial or sporadic cases. Using real time qPCR and discriminant function analysis, we identified 9 miRs whose expression levels rather than miR identity can discriminate between both patient groups. Candidate predicted targets were determined by combining results from miRWalk algorithms with mRNA expression profiles (n = 91 differently expressed genes). MiR/mRNA integrated analysis identified 91 candidate genes showing positive or negative correlation to at least 1 of the 9 miRs. Co-expression analysis of these genes with 9 miRs indicated that 49 differentially co-expressed miR-gene interactions changes in F-BC tumors as compared to those of NF-BC tumors. Out of 49, 17 (34.6%) of predicted miR-gene interactions showed an inverse correlation suggesting that miRs act as post-transcriptional regulators, whereas 14 (28.6%) miR-gene pairs tended to be co-expressed in the same direction indicating that the effects exerted by these miRs pointed to a complex level of target regulation. The remaining 18 pairs were not predicted by our criteria suggesting involvement of other regulators. MiR–mRNA co-expression analysis allowed us to identify changes in the miR-mRNA regulation that were able to distinguish tumors from familial and sporadic young BC patients non-carriers of BRCA mutations.</p></div

    Co-expression matrixes.

    No full text
    <p>Co-expression matrixes of the 91 differentially expressed genes vs 9 differentially expressed miRs for F-BC (A) and NF-BC (B), respectively. The colors represent the co-expression values reaching from 1 to −1 for red and green, respectively. F-BC, familial breast cancer; NF-BC, non-familial breast cancer.</p

    Cross-validation analysis graphic.

    No full text
    <p>Representative <i>cross-validation analysis</i> graphic of 35 patients from the F-BC and NF-BC groups. Black spots indicate F-BC samples while plus signs indicate NF-BC samples. The line represents the limit discriminant function between groups. F-BC, familial breast cancer; NF-BC, non-familial breast cancer.</p

    Illustration of network signatures.

    No full text
    <p>Seventeen miR–mRNA predicted interactions whose co-expression are significantly different between F-BC (A) and NF-BC (B) groups. Color edges represent positive (green) or negative (red) Pearson correlation values. The edge thickness indicates the magnitude of Pearson correlation values. The node size is proportional to the fold change of genes (orange nodes) and of miRs (blue nodes) between F-BC to NF-BC groups. F-BC, familial breast cancer; NF-BC, non-familial breast cancer.</p

    Patient and sample characteristics.

    No full text
    <p>POS = positive; NEG: negative; Trip. NEG: triple negative; GN: nuclear grade; GH: histological grade; ER: estrogen receptor; PR: progesterone receptor; HER-2: growth factor receptor type 2; NCCN: <i>National Comprehensive Cancer Network</i>. ER, PR, and Her-2 receptor status was defined according to IHC.TNM =  tumor classification based on stage according to TNM criteria suggested by WHO (World Health Organization): I (T1N0M0); IIA (T0N1M0, T1N1M0, T2N0M0); IIB (T2N1M0,T3N0M0); IIIA (T0N2M0, T1N2M0, T2N2M0, T3N1M0, T3N2M0); IIIB (T4N0M0,T4N1M0, T4N2M0); IV (every T, N, and M1).</p
    corecore