16 research outputs found

    Have we been Naive to Select Machine Learning Models? Noisy Data are here to Stay!

    Full text link
    The model selection procedure is usually a single-criterion decision making in which we select the model that maximizes a specific metric in a specific set, such as the Validation set performance. We claim this is very naive and can perform poor selections of over-fitted models due to the over-searching phenomenon, which over-estimates the performance on that specific set. Futhermore, real world data contains noise that should not be ignored by the model selection procedure and must be taken into account when performing model selection. Also, we have defined four theoretical optimality conditions that we can pursue to better select the models and analyze them by using a multi-criteria decision-making algorithm (TOPSIS) that considers proxies to the optimality conditions to select reasonable models

    Is the algorithm used to process heart rate variability data clinically relevant? Analysis in male adolescents

    Get PDF
    OBJECTIVE: To analyze whether the algorithm used for the heart rate variability assessment (fast Fourier transform versus autoregressive methods) influenced its association with cardiovascular risk factors in male adolescents. METHODS: This cross-sectional study included 1,152 male adolescents (aged 14 to 19 years). The low frequency, high frequency components (absolute numbers and normalized units), low frequency/high frequency ratio, and total power of heart rate variability parameters were obtained using the fast Fourier transform and autoregressive methods, while the adolescents were resting in a supine position. RESULTS: All heart rate variability parameters calculated from both methods were different (p<0.05). However, a low effect size (<0.1) was found for all parameters. The intra-class correlation between methods ranged from 0.96 to 0.99, whereas the variation coefficient ranged from 7.4 to 14.8%. Furthermore, waist circumference was negatively associated with high frequency, and positively associated with low frequency and sympatovagal balance (p<0.001 for both fast Fourier transform and autoregressive methods in all associations). Systolic blood pressure was negatively associated with total power and high frequency, whereas it was positively associated with low frequency and sympatovagal balance (p<0.001 for both fast Fourier transform and autoregressive methods in all associations). Body mass index was negatively associated with high frequency, while it was positively associated with low frequency and sympatovagal balance (p values ranged from <0.001 to 0.007). CONCLUSION: There are significant differences in heart rate variability parameters obtained with the fast Fourier transform and autoregressive methods in male adolescent; however, these differences are not clinically significant. OBJETIVO: Analisar se o algoritmo usado para avaliação da variabilidade da frequĂȘncia cardĂ­aca (transformada rĂĄpida de Fourier versus autoregressivo) influencia em sua associação com fatores de risco cardiovascular adolescentes do gĂȘnero masculino. MÉTODOS: Estudo transversal, que incluiu 1.152 adolescentes do gĂȘnero masculino (14 a 19 anos). Componentes de baixa e alta frequĂȘncia (absolutos e unidades normalizadas), razĂŁo componente de baixa frequĂȘncia/componente de alta frequĂȘncia e poder total da variabilidade da frequĂȘncia cardĂ­aca foram obtidos em repouso, na posição supina, usando os mĂ©todos transformada rĂĄpida de Fourier e autorregressivo. RESULTADOS: Todos os parĂąmetros da variabilidade da frequĂȘncia cardĂ­aca para ambos os mĂ©todos foram diferentes (p<0,05). Entretanto, um pequeno tamanho do efeito (<0,1) foi observado para todos os parĂąmetros. Os coeficientes de correlação intraclasse entre os mĂ©todos variaram de 0,96 a 0,99, enquanto os coeficientes de variação foram de 7,4 a 14,8%. A circunferĂȘncia abdominal foi negativamente associada com o componente de alta frequĂȘncia, e positivamente associada com o componente de baixa frequĂȘncia e o balanço simpatovagal (p<0,001 para a transformada rĂĄpida de Fourier e o autorregressivo em todas as associaçÔes). A pressĂŁo arterial sistĂłlica foi negativamente associada com o poder total e o componente de alta frequĂȘncia, enquanto foi positivamente associada com o componente de baixa frequĂȘncia e o balanço simpatovagal (p<0,001 para a transformada rĂĄpida de Fourier e o autorregressivo em todas as associaçÔes). O Ă­ndice de massa corporal foi negativamente associado com o componente de alta frequĂȘncia, enquanto foi positivamente associado com o componente de baixa frequĂȘncia e o balanço simpatovagal (valores de p variando de <0,001 a 0,007). CONCLUSÃO: Houve diferenças significantes nos parĂąmetros da variabilidade da frequĂȘncia cardĂ­aca obtidos com os mĂ©todos transformada rĂĄpida de Fourier e autorregressivo em adolescentes masculinos, mas essas diferenças nĂŁo foram clinicamente significativas

    Density as the Segregation Mechanism in Fish School Search for Multimodal Optimization Problems

    Get PDF
    Abstract. Methods to deal with Multimodal Optimization Problems (MMOP) can be classified in three main approaches, regarding the number and the type of desired solutions. In general, methods can be applied to find: (1) only one global solution; (2) all global solutions; and (3) all local solutions of a given MMOP. The simultaneous capture of several solutions of MMOPs without parameter adjustment is still an open question in optimization problems. In this article, we discuss a density segregation mechanism for Fish School Search to enable simultaneous capture of multiple optimal solutions of MMOPs with one single parameter. The new proposal is based on vanilla version of Fish School Search (FSS) algorithm, which is inspired on actual fish school behavior. The performance of the new algorithm is evaluated and compared to the performance of other methods such as NichePSO and Glowworm Swarm Optimization (GSO) for seven well-known benchmark functions of two dimensions. According to the obtained results, presented in this article, the new approach outperforms the algorithms NichePSO and GSO for all benchmark functions

    Um Sistema de Baixo Custo para Monitoramento do Consumo de Energia em Casas Inteligentes

    No full text
    Motivado pelo cenĂĄrio atual de desperdĂ­cio de energia devido Ă  falta de controle no consumo na sociedade, este trabalho propĂ”e um sistema para monitoramento do consumo de eletrodomĂ©sticos em casas inteligentes, usando um medidor nĂŁo invasivo, de baixo custo e fĂĄcil instalação. O medidor proposto utiliza o sensor de corrente SCT-013-030, conectado a uma placa ArduĂ­no capaz de enviar os dados de consumo via serial. Os testes com o medidor focaram na possibilidade de desagregar o consumo de cada eletrodomĂ©stico, classificando-os atravĂ©s da anĂĄlise do consumo agregado da casa. Os resultados mostraram que, considerando eletrodomĂ©sticos comuns e de alta potĂȘncia como um refrigerador, um ar-condicionado e um micro-ondas, foi possĂ­vel extrair padrĂ”es dos dados de consumo de cada aparelho, tornando possĂ­vel a classificação desses eletrodomĂ©sticos. O medidor construĂ­do pode servir de base para trabalhos futuros que se proponham ao desenvolvimento de sistemas nĂŁo invasivos de monitoramento de cargas que utilizem tĂ©cnicas de inteligĂȘncia computacional para classificação dos eletrodomĂ©sticos a partir de seus padrĂ”es de consumo

    Uso de Técnicas de Clusterização em uma Base de Dados Financeira.

    No full text
    O artigo tem como foco o uso de duas importantes técnicas computacionais para problemas de clusterização. Os algoritmos utilizados foram o K-Means e o Fuzzy C-Means (FCM), que aplicados em uma base de dados financeira de concessão de crédito pessoal podem auxiliar o tomador de decisão a identificar as principais características dos mutuårios que se encontravam adimplentes e mutuårios que estavam inadimplentes. O processo de clusterização investigou, através de 15 características (divididas entre características pessoais, condiçÔes de emprego e renda e condiçÔes da operação de crédito), similaridades que pudessem ajudar na formação de k grupos distintos. O resultado demonstra que as técnicas de agrupamentos aplicadas podem ser eficientes como ferramentas complementares para auxiliar o gestor financeiro nas suas atividades de classificação de risco, tomada de decisão e gerenciamento do crédito
    corecore