Search CORE

8 research outputs found

DI2: prior-free and multi-item discretization of biological data and its applications

Author: Alexandre Leonardo
Costa Rafael S.
Henriques Rui
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 01/09/2021
Field of study

Funding Information: This work was supported by Fundação para a Ciência e a Tecnologia (FCT), through IDMEC, under LAETA project (UIDB/50022/2020), IPOscore with reference (DSAIPA/DS/0042/2018), and ILU (DSAIPA/DS/0111/2018). This work was further supported by the Associate Laboratory for Green Chemistry (LAQV), financed by national funds from FCT/MCTES (UIDB/50006/2020 and UIDP/50006/2020), INESC-ID plurianual (UIDB/50021/2020) and the contract CEECIND/01399/2017 to RSC. The funding entities did not partake in the design of the study and collection, analysis, and interpretation of data and in writing the manuscript.Background: A considerable number of data mining approaches for biomedical data analysis, including state-of-the-art associative models, require a form of data discretization. Although diverse discretization approaches have been proposed, they generally work under a strict set of statistical assumptions which are arguably insufficient to handle the diversity and heterogeneity of clinical and molecular variables within a given dataset. In addition, although an increasing number of symbolic approaches in bioinformatics are able to assign multiple items to values occurring near discretization boundaries for superior robustness, there are no reference principles on how to perform multi-item discretizations. Results: In this study, an unsupervised discretization method, DI2, for variables with arbitrarily skewed distributions is proposed. Statistical tests applied to assess differences in performance confirm that DI2 generally outperforms well-established discretizations methods with statistical significance. Within classification tasks, DI2 displays either competitive or superior levels of predictive accuracy, particularly delineate for classifiers able to accommodate border values. Conclusions: This work proposes a new unsupervised method for data discretization, DI2, that takes into account the underlying data regularities, the presence of outlier values disrupting expected regularities, as well as the relevance of border values. DI2 is available at https://github.com/JupitersMight/DI2publishersversionpublishe

Directory of Open Access Journals

Repositório da Universidade Nova de Lisboa

An Efficient Algorithm for the Kolmogorov-Smirnov and Lilliefors Tests

Author: CONOVER W.J.
FZSHMAN G.S.
KNUZH D.E.
LXLLIEFORS H.W
Sartaj Sahni
Teofilo Gonzalez
W. R. Franta
Publication venue: 'Association for Computing Machinery (ACM)'
Publication date
Field of study

Crossref

PROPUESTA DE UN INDICADOR COMPUESTO PARA MEDIR LA VIABILIDAD POTENCIAL DE LOS CURSOS DE PREGRADO DE LA FACULTAD DE INGENIERÍA PARA SER IMPARTIDOS EN LA MODALIDAD DE EDUCACIÓN A DISTANCIA EN LA UNIVERSIDAD DE SAN CARLOS DE GUATEMALA

Author: Flores Interiano Julio Fernando
Publication venue
Publication date: 01/01/2023
Field of study

En el presente trabajo se propuso un indicador para medir el potencial de impartir cada curso de la Facultad de Ingeniería en la modalidad de educación a distancia virtual, con el fin de optimizar la distribución de recursos tecnológicos disponibles, dando prioridad a los cursos que tengan un mayor potencial. La investigación consistió en un estudio descriptivo, transversal y no experimental. La metodología utilizada se basó en la agregación de dos métricas, siendo la primera el estimador de desempeño académico, calculado mediante un contraste de medias de los datos históricos presenciales frente a los datos de modalidad a distancia, para cada uno de los cursos, obteniendo un punteo dependiendo del número de indicadores que fueron significativamente distintos. La segunda métrica es el estimador de la aprobación estudiantil, calculado mediante un modelo de regresión con base en las puntuaciones obtenidas de una muestra representativa de la población. Con los resultados obtenidos utilizando un indicador compuesto se concluye que de los 225 cursos; 52 obtuvieron una clasificación alta, 161 obtuvieron una clasificación media-alta, y 12 obtuvieron una clasificación media-baja. Ningún curso obtuvo un punteo con una clasificación baja. Por lo tanto, se sugiere a la Facultad de Ingeniería tomar en cuenta las estimaciones realizadas en este estudio, para predecir en qué cursos es más favorable crear secciones de educación a distancia virtual o híbridas, una vez se retomen las clases magistrales presenciales dentro del campus universitario

Repositorio Institucional USAC

Mensuração e previsão do custo da falha interna via modelo de simulação

Author: Loch Gustavo Valentim
Publication venue
Publication date: 26/11/2010
Field of study

Resumo: As falhas que ocorrem dentro de um processo produtivo podem gerar um custo adicional considerável para uma empresa. Portanto, parece ser importante dominar uma metodologia para mensurar e prever este custo, denominado custo da falha interna, e que possa ser utilizada como ferramenta de apoio ao processo de decisão. O custo das falhas internas ocorre devido aos defeitos detectados durante o processo produtivo. Este custo pode ser reduzido, por exemplo, por meio da utilização de diferentes insumos, aquisição de novos equipamentos e treinamento de pessoal. Então os gestores possuem dúvidas sobre questões, tais como: vale a pena realizar investimentos para reduzir determinados índices de falha? Qual o montante financeiro ideal a ser investido? Devido à grande complexidade do sistema, estas questões não têm respostas óbvias e, geralmente, não é fácil indicar as vantagens geradas pelos investimentos. A presente dissertação propõe um modelo matemático para mensurar o custo da falha interna e um modelo desimulação para prever os custos considerando diferentes cenários. Ao simular um cenário, tem-se o custo aproximado que será gerado pelas falhas internas caso este cenário venha a ser concretizado. Assim, será possibilitado aos gestores o conhecimento do impacto dos investimentos previstos, constituindo-se importante fonte de informação para a tomada de decisão. O modelo de custos e o modelo de simulação foram aplicados e avaliados na linha de produção de uma empresa, de grande porte, de aparelhos eletrônicos

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Repositório Digital Institucional da UFPR

Universidade Federal do Paraná