10 research outputs found

    A Genetic Programming Model for Association Studies to Detect Epistasis in Low Heritability Data

    Get PDF
    The genome-wide associations studies (GWAS) aims to identify the most influential markers in relation to the phenotype values. One of the substantial challenges is to find a non-linear mapping between genotype and phenotype, also known as epistasis, that usually becomes the process of searching and identifying functional SNPs more complex. Some diseases such as cervical cancer, leukemia and type 2 diabetes have low heritability. The heritability of the sample is directly related to the explanation defined by the genotype, so the lower the heritability the greater the influence of the environmental factors and the less the genotypic explanation. In this work, an algorithm capable of identifying epistatic associations at different levels of heritability is proposed. The developing model is a aplication of genetic programming with a specialized initialization for the initial population consisting of a random forest strategy. The initialization process aims to rank the most important SNPs increasing the probability of their insertion in the initial population of the genetic programming model. The expected behavior of the presented model for the obtainment of the causal markers intends to be robust in relation to the heritability level. The simulated experiments are case-control type with heritability level of 0.4, 0.3, 0.2 and 0.1 considering scenarios with 100 and 1000 markers. Our approach was compared with the GPAS software and a genetic programming algorithm without the initialization step. The results show that the use of an efficient population initialization method based on ranking strategy is very promising compared to other models

    DESCONTINUIDADE DE EMPRESAS BRASILEIRAS DO SETOR DE MATERIAL BÁSICO: NO PERÍODO COMPREENDIDO PRÉ E PÓS A CRISE DO SUBPRIME / Discontinuance of brazilian companies of basic materials sector: the period pre and post the subprime crisis

    Get PDF
    Descontinuidade de empresas é um tema cada vez mais estudado no campo da contabilidade, das finanças, dos negócios e da computação em decorrência do considerável impacto social causado pelo fracasso corporativo de uma entidade. Bancos, investidores, auditores, gerentes, fornecedores, empregados e muitos outros têm grandes interesses na acurácia da previsão de continuidade de uma companhia. Ainda há questões pouco estudadas na modelagem de previsão de insolvência. O desequilíbrio ou desbalanceamento dos dados sobre insolvência é uma dessas questões; em ambientes econômicos típicos o número de empresas classificadas como solventes é bem maior do que o daquelas classificadas como insolventes. O objetivo deste estudo foi comparar as variáveis contábeis selecionadas nas amostras das empresas do setor de material básico antes e após a crise do subprime, aplicando tecnologias de aprendizagem de máquinas em problemas de previsão de insolvência, utilizando técnicas de balanceamento da base de dados com (etapa de) seleção de atributos e, a partir disso, obter informações contábeis que levem a explicações das diferenças ocorridas na descontinuidade das empresas estudadas. Esta pesquisa é de natureza aplicada com abordagem quantitativa; quanto ao objetivo, é descritiva. A base de dados foi originada de demonstrativos contábeis de empresas brasileiras do setor econômico de material básico, listadas na Bovespa e na Serasa entre os anos 1994 e 2006 e 2007 e 2012. Os resultados obtidos evidenciaram a alteração de algumas variáveis selecionadas para a caracterização daquelas empresas que se tornaram descontínuas. Empresas do setor de material básico, no período estudado, 2007 a 2012, que se adequaram às exigências do mercado, privilegiando a liquidez em detrimento ao operacional, lograram sucesso em sua continuidade. Palavras-chave: Descontinuidade de empresas. Seleção de variáveis contábeis. Balanceamento de base de dados. Tecnologias de aprendizagem de máquina. Setor de material básico. Crise subprime Brasil

    Descontinuidade de empresas brasileiras do setor de consumo cíclico: Um estudo com dados contábeis utilizando técnicas de data mining

    No full text
    Discontinuity of companies is an issue that increasingly is being studied in the field of accounting and finance due to the considerable number of parts of the social fabric affected by the failure of a corporate entity. Banks, investors, governments, auditors, managers, suppliers, employees and many others have great interests in the accuracy of prediction of insolvency of a company. In Brazil, studies on the subject are still suffering the effects of being available only in databases with reduced dimensions, mostly due to data quality. But there is little studied issues in predictive modeling of insolvency. The balance or imbalance of data on insolvency is one of those issues in economic environments typical number of companies classified as solvent is much higher than those classified as insolvent. The aim of this study is to propose a new procedure for balancing of database problems in insolvency prediction with (step) feature selection. Was then constructed a strategy of data mining with the double virtue of selecting attributes and solve the problem of the imbalance. The database was derived from financial statements of Brazilian companies in the consumer cyclical economic sector, listed on the BOVESPA between the years 1996 and 2011. The results and validations performed demonstrate the success of the proposed strategy, improving the ability of the prediction model for the classification of companies belonging to the class of insolvent and thus consolidating it as quite competitive with other strategies presented in the specific literature. Given the nature of the empirical exercise, it is clear that the advantage of the new procedure does not depend on the studied sector. Keywords: Discontinuity of companies; Brazilian companies from the consumer discretionary sector, accounting variables, Data mining; Balancing database. Descontinuidade de empresas é um tema que cada vez mais vem sendo estudado no campo da contabilidade e finanças devido ao considerável número de partes do tecido social afetadas pelo fracasso corporativo de uma entidade. Bancos, investidores, governos, auditores, gerentes, fornecedores, empregados e muitos outros têm grandes interesses na acurácia da previsão de insolvência de uma companhia. No Brasil os estudos sobre o tema ainda sofrem o efeito de estarem disponíveis apenas em bases de dados com dimensões reduzidas, quase sempre devido à qualidade dos dados. Mas há questões pouco estudadas na modelagem de previsão de insolvência. O desequilíbrio ou desbalanceamento dos dados sobre insolvência é uma dessas questões, em ambientes econômicos típicos o número de empresas classificadas como solventes é bem maior do que o daquelas classificadas como insolventes. O objetivo deste estudo é propor um novo procedimento para balanceamento da base de dados em problemas de previsão de insolvência com (etapa de) seleção de atributos. Foi então construída uma estratégia de data mining com a dupla virtude de selecionar atributos e de resolver o problema do desequilíbrio. A base de dados foi originada de demonstrativos contábeis de empresas brasileiras do setor econômico de consumo cíclico, listadas na BOVESPA entre os anos de 1996 e 2011. Os resultados obtidos e as validações realizadas evidenciam o sucesso da estratégia proposta, melhorando a capacidade do modelo de previsão na classificação das empresas pertencentes à classe das insolventes e, assim consolidando-a como bastante competitiva com outras estratégias apresentadas na literatura específica. Dada a natureza do exercício empírico, fica evidente que a vantagem do novo procedimento não depende do setor estudado.Palavras-chave: Descontinuidade de empresas. Seleção de variáveis contábeis. Balanceamento de base de dados. Data mining. Setor de consumo cíclico – Brasil.La discontinuidad de las empresas es un tema que se está estudiando cada vez más en el campo de la contabilidad y las finanzas, debido al número considerable de partes del tejido social afectado por la falla de una entidad corporativa. Bancos, inversores, gobiernos, auditores, gerentes, proveedores, empleados y muchos otros tienen grandes intereses en la exactitud de la predicción de la insolvencia de una empresa. En Brasil, los estudios sobre el tema siguen sufriendo los efectos de estar disponible sólo en bases de datos de dimensiones reducidas, casi siempre debido a la calidad de los datos. Pero hay pocos temas estudiados en modelos de predicción de la insolvencia. El desequilibrio o insolvencia datos desequilibrio es uno de esos problemas, en entornos económicos típicos del número de empresas clasificadas como disolventes es mucho mayor que los clasificados como insolvente. El objetivo de este estudio es proponer un nuevo procedimiento para el equilibrio de los problemas de base de datos en la predicción de la insolvencia con (paso) de selección de características. A continuación, se construyó una estrategia de minería de datos con la doble virtud de la selección de atributos y resolver el problema de desequilibrio. La base de datos se deriva de los estados financieros de las empresas brasileñas en el sector de la economía de consumo cíclico, que se enumeran en la Bovespa entre los años 1996 y 2011. Los resultados y validaciones demuestran el éxito de la estrategia propuesta, la mejora de la capacidad del modelo de pronóstico para la clasificación de las empresas que pertenecen a la clase de insolvencia y por lo tanto la consolidación como bastante competitivo con otros enfoques sugeridos en la literatura. Dada la naturaleza del ejercicio empírico, está claro que la ventaja del nuevo procedimiento no depende de el sector estudiado. Palabras clave: Negocios discontinuados. La selección de las variables de contabilidad. Equilibrio de base de datos. La minería de datos. Sector Consumidor Discrecional - Brasil

    Previsão de insolvência de empresas brasileiras do setor industrial aplicando técnicas de mineração de dados

    No full text
    O objetivo deste estudo é destacar as características financeiras de empresas pertencentes ao setor de bens industriais que se tornaram insolventes para a construção de modelos de previsão de insolvência com maior precisão. Para se chegar a este objetivo foi aplicado um procedimento para balanceamento da base de dados, com a etapa de seleção de atributos, nos problemas de previsão de insolvência. No Brasil os estudos sobre insolvência ainda sofrem o efeito de estarem disponíveis apenas em bases de dados com dimensões reduzidas, quase sempre devido à qualidade dos dados. Foi então construído um procedimento de mineração de dados com a capacidade de selecionar atributos e de resolver o problema do desequilíbrio de classes para entender as implicações financeiras da insolvência dessas empresas. Esta pesquisa é de natureza aplicada com abordagem quantitativa, quanto ao objetivo, é descritiva. A base de dados foi originada de demonstrativos contábeis de empresas brasileiras do setor de bens industriais listadas na BM&FBOVESPA entre os anos de 1996 e 2013. Este setor foi escolhido porque suas empresas se caracterizam por apresentarem valores proporcionalmente altos em seus ativos imobilizados e valores pouco substanciais em seus ativos circulantes com níveis razoáveis de endividamento exigindo considerável investimento financeiro para produzir bens de alto valor na economia além de possuírem a capacidade de gerar milhões de postos de trabalho. O estudo concluiu que das 23 variáveis totais das empresas estudadas cinco foram selecionadas e são as seguintes: EOCpOT, TERFIN, LS, LC e EBITDA

    DESCONTINUIDADE DE EMPRESAS BRASILEIRAS DO SETOR DE MATERIAL BÁSICO: NO PERÍODO COMPREENDIDO PRÉ E PÓS A CRISE DO SUBPRIME / Discontinuance of brazilian companies of basic materials sector: the period pre and post the subprime crisis

    No full text
    Descontinuidade de empresas é um tema cada vez mais estudado no campo da contabilidade, das finanças, dos negócios e da computação em decorrência do considerável impacto social causado pelo fracasso corporativo de uma entidade. Bancos, investidores, auditores, gerentes, fornecedores, empregados e muitos outros têm grandes interesses na acurácia da previsão de continuidade de uma companhia. Ainda há questões pouco estudadas na modelagem de previsão de insolvência. O desequilíbrio ou desbalanceamento dos dados sobre insolvência é uma dessas questões; em ambientes econômicos típicos o número de empresas classificadas como solventes é bem maior do que o daquelas classificadas como insolventes. O objetivo deste estudo foi comparar as variáveis contábeis selecionadas nas amostras das empresas do setor de material básico antes e após a crise do subprime, aplicando tecnologias de aprendizagem de máquinas em problemas de previsão de insolvência, utilizando técnicas de balanceamento da base de dados com (etapa de) seleção de atributos e, a partir disso, obter informações contábeis que levem a explicações das diferenças ocorridas na descontinuidade das empresas estudadas. Esta pesquisa é de natureza aplicada com abordagem quantitativa; quanto ao objetivo, é descritiva. A base de dados foi originada de demonstrativos contábeis de empresas brasileiras do setor econômico de material básico, listadas na Bovespa e na Serasa entre os anos 1994 e 2006 e 2007 e 2012. Os resultados obtidos evidenciaram a alteração de algumas variáveis selecionadas para a caracterização daquelas empresas que se tornaram descontínuas. Empresas do setor de material básico, no período estudado, 2007 a 2012, que se adequaram às exigências do mercado, privilegiando a liquidez em detrimento ao operacional, lograram sucesso em sua continuidade.Palavras-chave: Descontinuidade de empresas. Seleção de variáveis contábeis. Balanceamento de base de dados. Tecnologias de aprendizagem de máquina. Setor de material básico. Crise subprime Brasil

    Descontinuidade de empresas brasileiras do setor de material básico: No período compreendido pré e pós a crise do subprime

    No full text
    Descontinuidade de empresas é um tema cada vez mais estudado no campo da contabilidade, das finanças, dos negócios e da computação em decorrência do considerável impacto social causado pelo fracasso corporativo de uma entidade. Bancos, investidores, auditores, gerentes, fornecedores, empregados e muitos outros têm grandes interesses na acurácia da previsão de continuidade de uma companhia. Ainda há questões pouco estudadas na modelagem de previsão de insolvência. O desequilíbrio ou desbalanceamento dos dados sobre insolvência é uma dessas questões; em ambientes econômicos típicos o número de empresas classificadas como solventes é bem maior do que o daquelas classificadas como insolventes. O objetivo deste estudo foi comparar as variáveis contábeis selecionadas nas amostras das empresas do setor de material básico antes e após a crise do subprime, aplicando tecnologias de aprendizagem de máquinas em problemas de previsão de insolvência, utilizando técnicas de balanceamento da base de dados com (etapa de) seleção de atributos e, a partir disso, obter informações contábeis que levem a explicações das diferenças ocorridas na descontinuidade das empresas estudadas. Esta pesquisa é de natureza aplicada com abordagem quantitativa; quanto ao objetivo, é descritiva. A base de dados foi originada de demonstrativos contábeis de empresas brasileiras do setor econômico de material básico, listadas na Bovespa e na Serasa entre os anos 1994 e 2006 e 2007 e 2012. Os resultados obtidos evidenciaram a alteração de algumas variáveis selecionadas para a caracterização daquelas empresas que se tornaram descontínuas. Empresas do setor de material básico, no período estudado, 2007 a 2012, que se adequaram às exigências do mercado, privilegiando a liquidez em detrimento ao operacional, lograram sucesso em sua continuidade.Palavras-chave: Descontinuidade de empresas. Seleção de variáveis contábeis. Balanceamento de base de dados. Tecnologias de aprendizagem de máquina. Setor de material básico. Crise subprime Brasil

    Um Estudo sobre Estrutura de Capital de Empresas Brasileiras utilizando Técnicas de Mineração de Dados em Variáveis Contábeis

    No full text
    Pesquisadores raramente empregam modelos não lineares para examinar os determinantes da estrutura de capital e fazem também pouco esforço para identificar se somente os dados contábeis apresentam resultados condizentes com a interpretação da política de financiamento das empresas. Por meio de técnicas de mineração de dados, utilizando dados de painel a qual contém mecanismos necessários para lidar tanto com a dinâmica intertemporal e da individualidade das empresas que estão sendo investigadas aplicando regressão de séries temporais transversal e as habilidades preditivas de redes neurais, este estudo foi realizado. Foram construídos modelos com esta técnica, utilizando um conjunto de variáveis contábeis para encontrar os atributos da razão da dívida por meio três técnicas de seleção de atributos, uma com origem na estatística (analise de componentes principais) e outras duas da aprendizagem de máquina (filtro e wrapper). Na técnica wrapper foram aplicados três classificadores, sendo dois lineares (regressão linear e robusta) e um não linear (redes neurais). A base de dados foi constituída de empresas classificadas, setorialmente, na Bolsa de Valores de São Paulo (BM&FBOVESPA) durante o período de 2010 a 2013. Os resultados sugerem que as variáveis contábeis explicativas das estratégias de alavancagem financeira somente rentabilidade sobre o ativo total e a rentabilidade dos acionistas estão em concordância com teorias de Pecking Order e de Trade-off. Além dessas variáveis também foram selecionadas: setor econômico, liquidez imediata e liquidez geral. Modelos construídos com redes neurais obtiveram o menor valor na raiz da média dos quadrados dos erros e o maior valor no coeficiente de correlação. Estes resultados revelam que as relações entre a razão da dívida e as variáveis contábeis determinantes são não-lineares e que redes neurais se mostraram capazes na modelagem em dados de painel para compreender a política de endividamento das empresas brasileira
    corecore