5 research outputs found

    Predicting the Readmission of Heart Failure Patients through Data Analytics

    Get PDF
    Reducing the costs and improving the quality of treatment in hospital systems as well as demands for better treatment from patients in order to keep them away from readmissions are two main issues healthcare systems have faced. In order to solve such challenges, predicting the occurrence of re-hospitalisation with data mining techniques would be so worthwhile. In this study, we are seeking to predict the occurrence of re-hospitalisation of the heart failure patients in two time-horizons (1-month and 3-month) via deployment of classification algorithms (i.e. decision trees, artificial neural networks, support vector machines and logistic regression). Two criterions (as main criterions) such as AUC (area under curve) and ACC (accuracy) have been calculated and assessed for classifying the prediction-power of the models in each time-horizon (outcome/target). We also have calculated some other criterions such as recall, precision and F1-Score. Then, we identified the importance and contribution of the variables for each outcome. Therefore, the variables whose contribution/importance changes over time are differentiated. It is noteworthy to say that this study is done under the scrutiny of an expert cardiologist. Trained nurses and expert cardiologist monitored the dataset every day, which was a hard and valuable measure to conduct. Finally, the dataset does not have missing values and noises. This research can be the basis for prospective medical studies and projects. © 2019 World Scientific Publishing Co

    Optimised Big Data analytics for health and safety hazards prediction in power infrastructure operations

    Get PDF
    © 2020 Elsevier Ltd Forecasting imminent accidents in power infrastructure projects require a robust and accurate prediction model to trigger a proactive strategy for risk mitigation. Unfortunately, getting ready-made machine learning algorithms to eliminate redundant features optimally is challenging, especially if the parameters of these algorithms are not tuned. In this study, a particle swarm optimization is proposed both for feature selection and parameters tuning of the gradient boosting machine technique on 1,349,239 data points of an incident dataset. The predictive ability of the proposed method compared to conventional tree-based methods revealed near-perfect predictions of the proposed model on test data (classification accuracy − 0.878 and coefficient of determination − 0.93) for the two outcome variables ACCIDENT and INJURYFREQ. The high predictive power obtained reveals that injuries do not occur in a chaotic fashion, but that underlying patterns and trends exist that can be uncovered and captured via machine learning when applied to sufficiently large datasets. Also, key relationships identified will assist safety managers to understand possible risk combinations that cause accidents; helping to trigger proactive risk mitigation plans

    Development and Application of Structural Equation Modeling Method For Geochemical Data Analysis

    Get PDF
    A new Structural Equation Modeling (SEM) approach was proposed and the corresponding algorithms were designed and implemented for model estimation and evaluation in this research. By way of contrast to traditional SEM methods which focus on confirmatory analysis, the new SEM approach is mainly designed for exploratory analysis, which has plenty of applications in geoscience data processing and interpretation. In order to generate an initial model for the new SEM analysis, a constrained variable clustering method was proposed based on a new index representing a type of conditional correlation, which was defined and calculated through SEM. Differently from the conventional conditional correlation coefficient, the new index was designed for measuring the quantity/percentage of the variance existing in two variables related to a response variable, rather than the level of independency of the two variables conditioned by a response variable. It can be used in Principal Component Analysis (PCA) and Factor Analysis (FA) for extracting factors restricted by a response variable. Thereby, these PCA and FA can be considered as constrained PCA and FA. The programs designed for the new SEM are model parameters estimation, conditional correlation coefficient calculation, clustering analysis, and the SEM-based Weights of Evidence (WofE) modeling. The new SEM technology was applied to a lake sediment geochemical dataset to assist for identification of multiple geochemical factors related to gold mineralization in a study area located in Southern Nova Scotia, Canada. The model was further applied in conjunction with the WofE method to integrate geochemical and geological information in mapping mineral potential in the same study area. The results showed that the application of the new SEM method could reduce the effect of the conditional dependency of the evidences involved in WofE

    Essays on Predictive Analytics in E-Commerce

    Get PDF
    Die Motivation für diese Dissertation ist dualer Natur: Einerseits ist die Dissertation methodologisch orientiert und entwickelt neue statistische Ansätze und Algorithmen für maschinelles Lernen. Gleichzeitig ist sie praktisch orientiert und fokussiert sich auf den konkreten Anwendungsfall von Produktretouren im Onlinehandel. Die “data explosion”, veursacht durch die Tatsache, dass die Kosten für das Speichern und Prozessieren großer Datenmengen signifikant gesunken sind (Bhimani and Willcocks, 2014), und die neuen Technologien, die daraus resultieren, stellen die größte Diskontinuität für die betriebliche Praxis und betriebswirtschaftliche Forschung seit Entwicklung des Internets dar (Agarwal and Dhar, 2014). Insbesondere die Business Intelligence (BI) wurde als wichtiges Forschungsthema für Praktiker und Akademiker im Bereich der Wirtschaftsinformatik (WI) identifiziert (Chen et al., 2012). Maschinelles Lernen wurde erfolgreich auf eine Reihe von BI-Problemen angewandt, wie zum Beispiel Absatzprognose (Choi et al., 2014; Sun et al., 2008), Prognose von Windstromerzeugung (Wan et al., 2014), Prognose des Krankheitsverlaufs von Patienten eines Krankenhauses (Liu et al., 2015), Identifikation von Betrug Abbasi et al., 2012) oder Recommender-Systeme (Sahoo et al., 2012). Allerdings gibt es nur wenig Forschung, die sich mit Fragestellungen um maschinelles Lernen mit spezifischen Bezug zu BI befasst: Obwohl existierende Algorithmen teilweise modifiziert werden, um sie auf ein bestimmtes Problem anzupassen (Abbasi et al., 2010; Sahoo et al., 2012), beschränkt sich die WI-Forschung im Allgemeinen darauf, existierende Algorithmen, die für andere Fragestellungen als BI entwickelt wurden, auf BI-Fragestellungen anzuwenden (Abbasi et al., 2010; Sahoo et al., 2012). Das erste wichtige Ziel dieser Dissertation besteht darin, einen Beitrag dazu zu leisten, diese Lücke zu schließen. Diese Dissertation fokussiert sich auf das wichtige BI-Problem von Produktretouren im Onlinehandel für eine Illustration und praktische Anwendung der vorgeschlagenen Konzepte. Viele Onlinehändler sind nicht profitabel (Rigby, 2014) und Produktretouren sind eine wichtige Ursache für dieses Problem (Grewal et al., 2004). Neben Kostenaspekten sind Produktretouren aus ökologischer Sicht problematisch. In der Logistikforschung ist es weitestgehend Konsens, dass die “letzte Meile” der Zulieferkette, nämlich dann wenn das Produkt an die Haustür des Kunden geliefert wird, am CO2-intensivsten ist (Browne et al., 2008; Halldórsson et al., 2010; Song et al., 2009). Werden Produkte retourniert, wird dieser energieintensive Schritt wiederholt, wodurch sich die Nachhaltigkeit und Umweltfreundlichkeit des Geschäftsmodells von Onlinehändlern relativ zum klassischen Vertrieb reduziert. Allerdings können Onlinehändler Produktretouren nicht einfach verbieten, da sie einen wichtigen Teil ihres Geschäftsmodells darstellen: So hat die Möglichkeit, Produkte zu retournieren positive Auswirkungen auf Kundenzufriedenheit (Cassill, 1998), Kaufverhalten (Wood, 2001), künftiges Kaufverhalten (Petersen and Kumar, 2009) und emotianale Reaktionen der Kunden (Suwelack et al., 2011). Ein vielversprechender Ansatz besteht darin, sich auf impulsives und kompulsives (LaRose, 2001) sowie betrügerisches Kaufverhalten zu fokussieren (Speights and Hilinski, 2005; Wachter et al., 2012). In gegenwärtigen akademschen Literatur zu dem Thema gibt es keine solchen Strategien. Die meisten Strategien unterscheiden nicht zwischen gewollten und ungewollten Retouren (Walsh et al., 2014). Das zweite Ziel dieser Dissertation besteht daher darin, die Basis für eine Strategie von Prognose und Intervention zu entwickeln, mit welcher Konsumverhalten mit hoher Retourenwahrscheinlichkeit im Vorfeld erkannt und rechtzeitig interveniert werden kann. In dieser Dissertation werden mehrere Prognosemodelle entwickelt, auf Basis welcher demonstriert wird, dass die Strategie, unter der Annahme moderat effektiver Interventionsstrategien, erhebliche Kosteneinsparungen mit sich bringt
    corecore