5 research outputs found

    Dengue fatality prediction using data mining

    Get PDF
    Dengue fever, a mosquito-borne tropical disease caused by the dengue virus is life-threatening. In Malaysia, although necessary control measures have been carried out, the number of dengue fever cases keeps increasing. Among the measures, dengue vector control appears to be the most effective way to control the spread of the dengue virus particularly in Malaysia. The aim of this research is to study the current implementation of dengue outbreak control in Malaysia and predict dengue fever cases using data mining techniques. Real data on dengue fever and weather are collected from the Ministry of Health in its Perak Tengah district office and Perak Meteorological office respectively. Different data mining classification techniques are applied onto these data with the performance of each technique is measured. The results highlight the best performance among techniques used.Keywords: data mining; prediction; dengue; classification

    Predictive analytics na infeção hospitalar

    Get PDF
    Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de InformaçãoAs infeções nosocomiais e a resistência antimicrobiana provocam um elevado número de morbidade e mortalidade nos pacientes hospitalizados. A Comissão de Controlo de Infeção (CCI) define medidas para combater a propagação de infeção nosocomial para outros doentes. No entanto, o controlo de infeção é ineficaz, uma vez que a sua deteção é feita de forma manual e por vezes tardia. A utilização de Predictive Analytics surge como uma possível solução para este problema, dado que permite a previsão automática e atempada de infeção, melhorando o tempo de resposta, e consequentemente, o controlo de infeção hospitalar. Nesta dissertação o principal objetivo passou por desenvolver modelos preditivos com boa capacidade de previsão de infeção nosocomial, a partir de técnicas de Data Mining (DM) e Machine Learning (ML). O desenvolvimento dos modelos de previsão foi realizado em contexto local e offline, e com dados reais provenientes do Hospital da Senhora da Oliveira de Guimarães. Deste modo, foram adotadas as metodologias Design Science Research Methodology (DSRM) e Cross-Industry Standard Process for Data Mining (CRISP-DM). O DSRM foi aplicado na investigação deste projeto de dissertação e o CRISP-DM foi usado para a aplicação de técnicas de DM. A abordagem de DM aplicada foi a Classificação e para que os modelos de DM pudessem ser criados, foram selecionadas seis técnicas baseadas em Árvores de Decisão (AD), Random Forest (RF), Redes Neuronais (RN), Naive Bayes (NB), Support Vector Machine (SVM) e Regressão Logística (RL). A avaliação dos modelos foi efetuada a partir da Matriz de Confusão, que permitiu a definição de sete métricas, Acuidade, Sensibilidade, Especificidade, Precisão, F1-Score, Índice Kappa e Curva AUC. Destas sete, a Acuidade e Sensibilidade, foram selecionadas como as mais importantes na decisão do melhor modelo. Os modelos de previsão concebidos apresentam uma grande capacidade de previsão de infeção nosocomial, com valores de Acuidade entre 71.56% a 99.37% e valores de Sensibilidade superiores a 90%. Os resultados obtidos são positivos e podem ajudar os profissionais de saúde na tomada de decisão ao nível da gestão e controlo de infeção nosocomial.Nosocomial infections and antimicrobial resistance cause a high number of morbidity and mortality in hospitalized patients. The Infection Control Commission (ICC) defines measures to combat the spread of nosocomial infection to other patients. However, the infection control is ineffective, since its detection is done manually and sometimes late. The use of Predictive Analytics is a possible solution to this problem, since it allows the automatic and timely prediction of infection, improving the response time, and consequently, the infection control of the hospital. The main objective of this dissertation was to develop predictive models with good predicitve ability for nosocomial infection, based on Data Mining (DM) and Machine Learning techniques. The development of the predictive models was performed in a local and offline context, and with real data from Hospital da Senhora da Oliveira in Guimarães. Thus, the Design Science Research Methodology (DSRM) and Cross Industry Standard Process for Data Mining (CRISP-DM) methodologies were adopted. The DSRM was applied in the research of this dissertation project and the CRISP-DM was used for the application of DM techniques. The DM approach applied was Classification and so that the DM models could be created, six techniques were selected based on Decision Trees (DT), Random Forest (RF), Neural Networks (NN), Naive Bayes (NB), Support Vector Machine (SVM) and Logistic Regression (LR). The evaluation of the modes was performed from the Confusion Matrix, which allowed the definition of seven metrics, Accuracy, Recall, Specificity, Precision, F1-Score, Kappa Statistic and AUC Curve. Of these seven, Accuracy and Recall were selected as the most importante in deciding the best model. The designed prediction models show a high predictive capacity for nocomial infection, with Accuracy values between 71.56% and 99.37%, and Recall values above 90%. The results obtained are positive and can help heath professionals in decision-making in nosocomial infection control and management

    Previsão dos fatores de risco e caracterização de doentes internados nos cuidados intensivos

    Get PDF
    Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de InformaçãoA Medicina Intensiva (MI) é uma das áreas mais críticas da Medicina. A sua característica multidisciplinar torna-a muito abrangente, reunindo todo o tipo de profissionais de saúde, bem como um local com equipamentos e condições especiais, denominadas Unidades de Cuidados Intensivos (UCI). Tendo em conta o seu ambiente crítico torna-se evidente a necessidade de prever admissões às UCI, pois, para além de constituírem custos adicionais para as instituições e ocuparem recursos desnecessariamente, admissões não planeadas são arriscadas para os doentes que se encontram debilitados. Ao longo dos anos os Sistemas de Informação (SI) têm acompanhando o desenvolvimento da Medicina, tornando-se instrumentos imprescindíveis para o tratamento de doentes, sobretudo através dos Sistemas de Apoio à Decisão (SAD) que apresentam as informações pertinentes sobre os doentes, sem necessidade análise manual de dados. Deste modo, a utilização de SAD na Medicina é crucial, principalmente na MI, em que as decisões têm, muito frequentemente, de ser tomadas com celeridade sempre no melhor interesse do doente. Um SAD pode ser constituído por diferentes técnicas, como é o caso do Data Mining (DM). A presente dissertação envolve descoberta de conhecimento em bases de dados extraídas a partir do sistema de apoio à decisão INTCare, localizado no Centro Hospitalar do Porto (CHP). Foi utilizado um conjunto de técnicas de DM, nomeadamente Clustering e Classificação, tendo por base diferentes algoritmos e métricas de avaliação. Assim foram descobertos padrões naturais nos dados, nomeadamente através da formação de dois grupos de características (Clusters) dos doentes internados em UCI e identificando os atributos mais críticos nestes Clusters. Além disso, foram obtidas previsões com cerca de 97% de capacidade de acertar nos doentes internados (sensibilidade) e que, apesar de criar demasiados Falsos Positivos (63% de especificidade), permitiu obter modelos que permitam que os médicos possam agir de forma proactiva e preventiva, tendo sido esta uma das principais motivações desta dissertação. A presente dissertação serviu para aumentar o número de estudos que aplicam técnicas de DM em MI, particularmente para realização de previsão de internamentos em UCI. Deste modo, contribui-se com conhecimento para a comunidade científica não só de DM, mas também para a Medicina, de modo a potenciar o processo de tomada de decisão médica e na procura pela melhoria dos serviços prestados aos doentes.Intensive Medicine is one of the most critical areas of medicine. Its multidisciplinary feature makes it a very wide area that gathers all kinds of health professionals as well as a place with special equipment and conditions known as Intensive Care Unit. Having in account its critical environment it becomes evident the need to forecast Intensive Care Unit admissions because, besides being additional costs for institutions and occupy resources unnecessarily, unplanned admissions are risky for patients who are debilitated. Over the years, Information Systems are accompanying the development of medicine and have become essentials instruments for the treatment of patients especially using Clinical Systems Decision Support that have relevant information about patients without the need to manually analyse clinical data. Therefore, the use of DSS is crucial in medicine, particularly in the IM in which decisions must very often be taken speedily always in the best interest of the patient. This Decision Support Systems may be constituted by different techniques such as Data Mining (DM). This dissertation involves knowledge discovery in databases extracted from the Clinical Decision Support System being used in Centro Hospital do Porto (CHP) and named INTCare System. It was used a set of DM and rating techniques including clustering and classification which are based on different algorithms and evaluation metrics. Thereby, natural patterns were discovered in the data particularly through the formation of two groups of characteristics (clusters) of patients admitted to Intensive Care Unit and through the identification the most critical attributes in these clusters. Moreover, it was obtained predictions with approximately 97% of ability to get properly forecast admissions to Intensive Care Unit (Sensitivity) and despite creating too many false positives (63% specificity) it also created models that allow doctors to act proactively and preventively which is one of the main motivations of this dissertation. This dissertation served to increase the number of studies that apply DM techniques in Intensive Medicine particularly for performing predictions of admissions to Intensive Care Units. Thus, knowledge was created for the scientific community not only of DM, but also of medicine in order to promote the process of clinical decision-making and to improve services rendered to patients

    Kamu hizmetlerinde veri madenciliği : Çözüm masası verileri temelinde bir araştırma

    Get PDF
    06.03.2018 tarihli ve 30352 sayılı Resmi Gazetede yayımlanan “Yükseköğretim Kanunu İle Bazı Kanun Ve Kanun Hükmünde Kararnamelerde Değişiklik Yapılması Hakkında Kanun” ile 18.06.2018 tarihli “Lisansüstü Tezlerin Elektronik Ortamda Toplanması, Düzenlenmesi ve Erişime Açılmasına İlişkin Yönerge” gereğince tam metin erişime açılmıştır.Kurumlar tarafından kullanılan yönetim bilişim sistemleri, gelişen akıllı teknolojilerin etkisiyle oluşan büyük veriden gizli bilgi örüntülerinin çıkarılması ve geleceğe dönük kararlarda kurum yöneticilerine karar desteğinin sağlanması büyük önem arz etmektedir. Kamu yönetimi disiplininde teknoloji odaklı çalışmalar genellikle teorik düzeyde ve ağırlıklı olarak "e-devlet" konusunda yoğunlaşmaktadır. Veri madenciliği uygulamaları ise genellikle yönetim bilişim sistemleri, bilgisayar bilimleri ve işletme gibi disiplinlerde özel sektör verisi ile çalışılmaktadır. Bu çalışma, veri madenciliği konusunu kamu yönetimi ile yönetim bilişim sistemleri disiplinlerine dayalı olarak incelemektedir. Çalışmanın uygulama bölümünde, literatürdeki genel eğilimden farklı olarak, kamu verisiyle veri madenciliği uygulaması gerçekleştirilmiştir. Veri madenciliği için, bir büyükşehir belediyesinden elde edilen çözüm masası verileri Naive Bayes, Destek Vektör Makinesi, K-En Yakın Komşuluk ve Karar Ağaçları gibi makine öğrenmesi algoritmaları kullanılarak analiz edilmiştir. Elde edilen bulguların görsel gösterimi içinse iş zekâsı uygulaması olan "Tableu" kullanılmıştır. Çalışmada, Türkiye'de büyük verinin son yıllarda kamu sektörü kuruluşlarında yaygınlaştığı, kurumların stratejik planlarında yer verildiği, ancak veri madenciliği uygulamalarının çok az kurumda etkin olarak kullanıldığı sonucuna varılmıştır. Uygulama bulguları, yapılandırılmamış veri üzerinde ön işleme aşamasının dikkatli ve doğru şekilde yapılmasının makine öğrenmesinin doğruluk oranlarına doğrudan etki ettiğini göstermesi açısından önemlidir. Büyük veri ve veri madenciliği uygulamalarının, hükümet hizmetlerini, ayrıca devlet operasyonlarını, politika üretme ve yönetimini geliştirmek için kamu sektörü tarafından etkin olarak kullanılabileceği sonucuna ulaşılmıştır. Veri madenciliğinin yalnızca sayısal yöntemleri içeren yazılım aracı değil; çözümüne ihtiyaç duyulan probleme göre tasarlanmış, ilgili yöntem, teknik ve uygulamaları da kapsayan, sonuçları itibariyle probleme ait ilişki, kural ve örüntüyü modelleyen ve gösteren bir süreç olarak kamu hizmetlerinde kullanılabileceğini göstermesi açısından da bu tez önem arz etmektedir.Management information systems used by the goverments and public agencies are crucial in terms of acquiring latent information patterns comprised from big data generated by the developing smart technologies and provision of decision supports on future decisions to policy makers and public managers. Technology-based studies in public administration are generally conducted on the basis of theoretical and practical dimensions of "e-government". Data mining applications are usually studied with focusing on private sector data in disciplines such as management information systems, computer sciences and business administration. This study examines data mining, on the accounts of the disciplines of public administration and management information systems. In the empirical part of the study, fourth chapter, data mining process is implemented with public data, unlike the general tendency in the literature. The help desk data of the Kocaeli Metropolitan Municipality is used in the study. Preprocessing of data and classification methods are implemented via "Weka Machine Learning" tool. The help desk data is analyzed using a number of machine learning algorithms such as Naive Bayes, Support Vector Machine, K-Nearest Neighborhood and Decision Trees. The results were visualized with a business intelligence application called "Tableu". It was concluded that while there is an increasing awareness in reent years on big data technologies and data mining in governments and public agencies in Turkey, the number of applications and projects have still been outnumbered. In essence our study shows that, careful and accurate pre-processing of the raw data, qualitative or quantitative, has a direct impact on the accuracy of machine learning algortihms. Finally, it seems that big data and data mining applications can be effectively used by the public agencies to enhance government operations, to provide effective and efficient public services, and to improve the quality of public policy-making. Data mining is not only a software tool that contains numerical methods; but it includes methods and applications intented to solve the real world problems. This thesis is also important in that it shows data mining can be adopted in public services with a generic model
    corecore