5 research outputs found

    Handling Class Imbalance Using Swarm Intelligence Techniques, Hybrid Data and Algorithmic Level Solutions

    Get PDF
    This research focuses mainly on the binary class imbalance problem in data mining. It investigates the use of combined approaches of data and algorithmic level solutions. Moreover, it examines the use of swarm intelligence and population-based techniques to combat the class imbalance problem at all levels, including at the data, algorithmic, and feature level. It also introduces various solutions to the class imbalance problem, in which swarm intelligence techniques like Stochastic Diffusion Search (SDS) and Dispersive Flies Optimisation (DFO) are used. The algorithms were evaluated using experiments on imbalanced datasets, in which the Support Vector Machine (SVM) was used as a classifier. SDS was used to perform informed undersampling of the majority class to balance the dataset. The results indicate that this algorithm improves the classifier performance and can be used on imbalanced datasets. Moreover, SDS was extended further to perform feature selection on high dimensional datasets. Experimental results show that SDS can be used to perform feature selection and improve the classifier performance on imbalanced datasets. Further experiments evaluated DFO as an algorithmic level solution to optimise the SVM kernel parameters when learning from imbalanced datasets. Based on the promising results of DFO in these experiments, the novel approach was extended further to provide a hybrid algorithm that simultaneously optimises the kernel parameters and performs feature selection

    Segmentación de usuarios en la oficina de farmacia mediante algoritmos bioinspirados

    Get PDF
    Programa de Doctorado en Estadística e Investigación OperativaLa situación de las oficinas de farmacia, desde el punto de vista del negocio, está pasando por uno de sus momentos más complejos. El entorno económico y las reformas llevadas a cabo están incidiendo en su cuenta de resultados y, de manera directa, en la dispensación de medicamentos financiados por el Sistema Nacional de Salud. Prueba de esta situación es la tendencia decreciente del gasto sanitario público en el período 2008-2012 (último periodo disponible como estadística oficial cuya publicación se denomina "Estadística de Gasto Sanitario Público" del Ministerio de Sanidad, Servicios Sociales e Igualdad). En este periodo, el gasto sanitario público ha decrecido en promedio a razón de un 1,05% anual, mientras que el gasto por habitante también ha decrecido a razón de un 1,64%. Las consecuencias sobre las oficinas de farmacia, entre otras, han sido: el empeoramiento de la situación financiera, la disminución de los márgenes comerciales y el importe del ticket medio. Para añadir algo más de intranquilidad al mercado farmacéutico, el propio modelo de farmacia español no ha estado exento de turbulencias en los últimos años. La primera década del siglo XXI ha supuesto para el sector farmacéutico de los países mediterráneos una época de intranquilidad pues su modelo de establecimiento farmacéutico ha sido cuestionado severamente por las autoridades de la Unión Europea. Por todo ello, sin dejar de lado su rol como actor promotor de la salud dentro del sistema sanitario, entendemos que su negocio debe ser próspero para que la prestación de servicios (dispensación, atención farmacéutica, formación, información, asesoramiento, etc.) se desarrollen de la forma más eficaz y eficiente posible. Analizada la situación actual, hemos observado que es inexistente la utilización de técnicas y algoritmos de segmentación de usuarios e incipiente la distinción entre clientes y pacientes en las oficinas de farmacia. Es por este motivo, que proponemos esta investigación con el objetivo principal de encontrar un modelo de caracterización de los usuarios (clientes y pacientes) de una oficina de farmacia en base a variables discriminantes y con la ayuda de un algoritmo de segmentación bioinspirado adecuado y contrastado. Identificados los segmentos homogéneos de sus clientes, se pueden desarrollar estrategias personalizadas para atenderlos. Para la caracterización de usuarios, se propone el uso de técnicas estadísticas de clustering basadas en algoritmos metaheurísticos, previa comparación con otros algoritmos, esperando que el resultado sea satisfactorio en la caracterización de los usuarios en bases de datos de grandes dimensiones. Desde el punto de vista de metodológico, se describe el algoritmo de segmentación propuesto y se realizan diferentes ejecuciones de él, con un software desarrollado ex profeso, en diferentes conjuntos de datos para probar sus prestaciones. Además se detalla la encuesta realizada a farmacéuticos de la provincia de Sevilla, como método e instrumento para apoyar la conveniencia de esta investigación. Como principales conclusiones, se obtiene que DECCS, el algoritmo bionspirado propuesto, mejora las prestaciones de los algoritmos clásicos seleccionados, tanto en los problemas utilizados de tamaño medio como en los de gran tamaño. Con respecto a su predecesor ACDE, lo supera en tres de los cuatro problemas de gran tamaño seleccionados. Con lo que se muestra un algoritmo solvente y eficaz para problemas de mayor tamaño. Esta conclusión se ve reforzada por el hecho de que en el caso de los problemas de tamaño medio, ambos tienen comportamientos similares. La aplicación de DECCS a una base de datos del año 2014 completo, correspondiente a una oficina de farmacia, ha resultado un éxito. El algoritmo ha caracterizado dos grupos claros de clientes, según el tipo de producto retirado en la farmacia: medicamento o producto de venta libre (incluyendo medicamentos sin receta "OTC").Universidad Pablo de Olavide. Departamento de Economía, Métodos Cuantitativos e Historia Económic

    Data-driven parameter and model order reduction for industrial optimisation problems with applications in naval engineering

    Get PDF
    In this work we study data-driven reduced order models with a specific focus on reduction in parameter space to fight the curse of dimensionality, especially for functions with low-intrinsic structure, in the context of digital twins. To this end we proposed two different methods to improve the accuracy of responce surfaces built using the Active Subspaces (AS): a kernel-based approach which maps the inputs onto an higher dimensional space before applying AS, and a local approach in which a clustering induced by the presence of a global active subspace is exploited to construct localized regressors. We also used AS within a multi-fidelity nonlinear autoregressive scheme to reduced the approximation error of high-dimensional scalar function using only high-fidelity data. This multi-fidelity approach has also been integrated within a non-intrusive Proper Oorthogonal Decomposition (POD) based framework in which every modal coefficient is reconstructed with a greater precision. Moving to optimization algorithms we devised an extension of the classical genetic algorithm exploiting AS to accelerate the convergence, especially for highdimensional optimization problems. We applied different combinations of such methods in a diverse range of engineering problems such as structural optimization of cruise ships, shape optimization of a combatant hull and a NACA airfoil profile, and the prediction of hydroacoustic noises. A specific attention has been devoted to the naval engineering applications and many of the methodological advances in this work have been inspired by them. This work has been conducted within the framework of the IRONTH project, an industrial Ph.D. grant financed by Fincantieri S.p.A

    Selected Papers from SDEWES 2017: The 12th Conference on Sustainable Development of Energy, Water and Environment Systems

    Get PDF
    EU energy policy is more and more promoting a resilient, efficient and sustainable energy system. Several agreements have been signed in the last few months that set ambitious goals in terms of energy efficiency and emission reductions and to reduce the energy consumption in buildings. These actions are expected to fulfill the goals negotiated at the Paris Agreement in 2015. The successful development of this ambitious energy policy needs to be supported by scientific knowledge: a huge effort must be made in order to develop more efficient energy conversion technologies based both on renewables and fossil fuels. Similarly, researchers are also expected to work on the integration of conventional and novel systems, also taking into account the needs for the management of the novel energy systems in terms of energy storage and devices management. Therefore, a multi-disciplinary approach is required in order to achieve these goals. To ensure that the scientists belonging to the different disciplines are aware of the scientific progress in the other research areas, specific Conferences are periodically organized. One of the most popular conferences in this area is the Sustainable Development of Energy, Water and Environment Systems (SDEWES) Series Conference. The 12th Sustainable Development of Energy, Water and Environment Systems Conference was recently held in Dubrovnik, Croatia. The present Special Issue of Energies, specifically dedicated to the 12th SDEWES Conference, is focused on five main fields: energy policy and energy efficiency in smart energy systems, polygeneration and district heating, advanced combustion techniques and fuels, biomass and building efficiency

    Advances in knowledge discovery and data mining Part II

    Get PDF
    19th Pacific-Asia Conference, PAKDD 2015, Ho Chi Minh City, Vietnam, May 19-22, 2015, Proceedings, Part II</p
    corecore