12 research outputs found

    Improvement in the prediction of the translation initiation site through balancing methods, inclusion of acquired knowledge and addition of features to sequences of mRNA

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>The accurate prediction of the initiation of translation in sequences of mRNA is an important activity for genome annotation. However, obtaining an accurate prediction is not always a simple task and can be modeled as a problem of classification between positive sequences (protein codifiers) and negative sequences (non-codifiers). The problem is highly imbalanced because each molecule of mRNA has a unique translation initiation site and various others that are not initiators. Therefore, this study focuses on the problem from the perspective of balancing classes and we present an undersampling balancing method, M-clus, which is based on clustering. The method also adds features to sequences and improves the performance of the classifier through the inclusion of knowledge obtained by the model, called InAKnow.</p> <p>Results</p> <p>Through this methodology, the measures of performance used (accuracy, sensitivity, specificity and adjusted accuracy) are greater than 93% for the <it>Mus musculus</it> and <it>Rattus norvegicus</it> organisms, and varied between 72.97% and 97.43% for the other organisms evaluated: <it>Arabidopsis thaliana</it>, <it>Caenorhabditis elegans</it>, <it>Drosophila melanogaster</it>, <it>Homo sapiens</it>, <it>Nasonia vitripennis</it>. The precision increases significantly by 39% and 22.9% for <it>Mus musculus</it> and <it>Rattus norvegicus</it>, respectively, when the knowledge obtained by the model is included. For the other organisms, the precision increases by between 37.10% and 59.49%. The inclusion of certain features during training, for example, the presence of ATG in the upstream region of the Translation Initiation Site, improves the rate of sensitivity by approximately 7%. Using the M-Clus balancing method generates a significant increase in the rate of sensitivity from 51.39% to 91.55% (<it>Mus musculus</it>) and from 47.45% to 88.09% (<it>Rattus norvegicus</it>).</p> <p>Conclusions</p> <p>In order to solve the problem of TIS prediction, the results indicate that the methodology proposed in this work is adequate, particularly when using the concept of acquired knowledge which increased the accuracy in all databases evaluated.</p

    Predição de função de proteínas através da extração de características físico-químicas

    Get PDF
    Com a conclusão do projeto Genoma, o número de novas proteínas descobertas tem crescido, mas devido ao alto custo e da demora dos processos de descoberta da função de proteínas, apenas uma pequena parcela das mesmas tem sua função conhecida. Este trabalho apresenta uma metodologia para predição de função de proteínas através da extração de características de suas estruturas, presentes no banco de dados StingDB, a utilização da Transformada Discreta do Cosseno, a codificação da estrutura primária, o balanceamento de classes e a utilização de Máquinas de Vetores de Suporte. Os valores médios obtidos para a precisão, sensibilidade, acurácia e especificidade foram, respectivamente de 80\%, 71%, 74% e 77%. Os resultados foram comparados com outros trabalhos da literatura, e mostraram um aumento de 10% na taxa de precisão

    O Impacto da Qualidade do Registro Hospitalar de Câncer na Análise de Sobrevida dos Pacientes Diagnosticados com Neoplasia: Um Estudo de Caso em um Hospital Brasileiro / The Impact of Quality of Hospital Cancer Registry on Survival Analysis of Patients Diagnosed with Neoplasia: A Case Study in a Brazilian Hospital

    Get PDF
    A análise de sobrevivência é uma técnica estatística usada para analisar um fenômeno ao longo de um período. Os indivíduos são monitorados através do evento, no nosso caso específico, a morte. Calculamos a sobrevida de cinco neoplasias do Registro Hospitalar de um Hospital brasileiro. As variáveis avaliadas: sexo, idade, raça/cor, escolaridade, tempo entre diagnóstico e tratamento, estágio da doença, ocorrência de metástases e histórico familiar de câncer, alcoolismo e tabagismo. A sobrevida global estimada em cinco anos foi de 97,8% para câncer de colo do útero, 96,5% para a próstata, 95,5% para a leucemia, 95,0% para a mama e 52,9% para o pulmão. A influência das variáveis demográficas e clínicas sobre esses tipos de câncer também foi avaliada. Os resultados indicam que, para o câncer de mama, os pacientes com melhor prognóstico foram: câncer diagnosticado nos estágios iniciais, sem histórico familiar de câncer e pacientes com mais de 50 anos de idade. Há melhor sobrevida em tempos de espera mais curtos entre o diagnóstico e o tratamento do câncer de próstata e do colo do útero

    Consumo alimentar segundo classificação NOVA e excesso de peso em pessoas com osteoartrite de joelho

    Get PDF
    Objetivo: Investigar o consumo alimentar segundo o grau de processamento em pessoas com osteoartrite do joelho (OAJ). Materiais e Métodos: Estudo transversal com amostra não probabilística de portadores de OAJ e em tratamento fisioterapêutico e nutricional numa Clínica Escola de Fisioterapia. Os participantes foram submetidos à avaliação sociodemográfica, dietética e antropométrica. O consumo alimentar foi avaliado por meio de questionário de frequência de consumo alimentar e foi analisado segundo classificação NOVA de alimentos. A avaliação da associação entre excesso de peso e OAJ foi realizada por meio da análise de regressão correlação e regressão linear. Resultados: O grupo de alimentos in natura contribuiu com 59,5% do consumo energético, seguido respectivamente pelo grupo de alimentos processados (18,9%), alimentos ultraprocessados (13,0%) e ingredientes culinários (8,3%). A média do percentual de consumo nos quatro grupos de processamento de alimentos foi maior entre os com excesso de peso. Na análise de regressão linear foi identificado que maior consumo de energia advinda de alimentos processados esteve relacionado a um aumento no IMC dos participantes (ß=0,440; p-valor=0,001) enquanto o consumo de alimentos in natura, minimamente processados e preparações culinárias à base desses alimentos esteve relacionada a redução (ß=-0,263; p-valor=0,038) no mesmo. Conclusão: Os resultados apresentados indicam que o consumo de alimentos ultraprocessados foi baixo na amostra avaliada, apesar da maioria apresentar elevado índice de massa corporal, o que nos faz supor que outras variáveis podem estar influenciando esse resultado, como por exemplo, a osteoartrite e idade elevada que favorece o sedentarismo

    Segurança alimentar em uma comunidade rural no Alto Vale do Jequitinhonha/Mg

    Get PDF
    O presente estudo buscou descrever a situação de segurança alimentar vivenciada por famílias residentes na comunidade rural de Galheiros do município de Diamantina, situada no Alto Vale do Jequitinhonha, no Estado de Minas Gerais, Brasil. Foi utilizada a Escala Brasileira de Insegurança Alimentar - EBIA - com 15 questões que refletem a insegurança alimentar em diferentes níveis de intensidade. Foram investigadas 28 famílias, e obtidas informações sobre renda familiar, renda per capita, condição sócio econômica, de moradia, de saneamento básico e consumo alimentar. A prevalência de insegurança alimentar encontrada na comunidade foi de 46,4%, sendo 32,14% leve, 3,6% moderada e 10,7% grave. Mais da metade das famílias (57,2%) viviam com o equivalente a ½ do salário mínimo por mês. A maioria das famílias (75,0%) relatou gastar com alimentação valores inferiores a R$ 350,00, e 53,6% relataram receber da união e/ou Estado algum tipo de benefício. Estes resultados demonstram que apesar de existir no Brasil políticas públicas de combate à fome, grande parte das famílias residentes em Galheiros, vive em vulnerabilidade social, assim sendo, são necessárias ações estruturantes para reverter tal quadro, tanto no que se refere à produção de alimentos, quanto ao acesso a alimentos em qualidade e quantidade suficiente

    Análise da influência cultural na interação dos usuários com o Facebook sob a ótica de tecnologias persuasivas/ Análisis de la influencia cultural en la interacción del usuario con Facebook desde la perspectiva de las tecnologías persuasivas

    Get PDF
    O Facebook é uma rede social usada por mais de um bilhão de usuários, e está presente em vários países tentando influenciar as pessoas a adotarem determinados comportamentos alvos. Este trabalho foi realizado visando analisar a influência cultural na interação dos usuários no contexto das tecnologias persuasivas. Para isso foi realizado um estudo de caso sobre a utilização da rede social Facebook, comparando o Brasil com outros países, sendo os dados da utilização obtidos via questionários e analisados por métodos estatísticos. Concluiu-se que os usuários das culturas analisadas possuem comportamento semelhante na rede

    Algorithms Analysis in Adjusting the SVM Parameters: An Approach in the Prediction of Protein Function

    No full text
    Support Vector Machine (SVM) is a supervised learning algorithm widely used in data classification problems. However, the quality of the solution is related to the chosen kernel function, and the adjustment of its parameters. In the present study we compare a genetic algorithm (GA), a particle swarm optimization(PSO), and the grid-search in setting the parameters γ\gamma and C of SVM. After running some experimental tests based on the prediction of protein function, it is concluded that all algorithms are suitable to set the SVM parameters efficiently, yet grid-search runs up to 6 times faster than GA and 30 times faster than PSO
    corecore