research

Usefulness of Bayesian networks in epidemiological studies

Abstract

Introduction: Bayesian networks are a form of statistical modelling, which has been widely used in fields like clinical decision, systems biology, human immunodeficiency virus (HIV) and influenza research, analyses of complex disease systems, interactions between multiple diseases and, also, in diagnostic diseases. The present study aimed to show the usefulness of Bayesian networks (BNs) in epidemiological studies. Material and Methods: 3,993 subjects (men 1,758, women 2,235) belonging to the public productive sector from the Balearic Islands (Spain), which were active workers, constitute the data set. Results: A BN was built from a dataset composed of twelve relevant features in cardiovascular disease epidemiology. Furthermore, the structure and parameters were learnt with GeNIe 2.0 tool. Taking into account the main topological properties some features were optimized, obtaining a hypothesized scenario where the likelihoods of the different features were updated and the adequate conclusions were established. Conclusions: Bayesian networks allow us to obtain a hypothetical scenario where the probabilities of the different features are updated according to the evidence that is introduced. This fact makes Bayesian networks a very attractive tool.Introducción: Las redes Bayesianas son una forma de modelización estadística, las cuales han sido ampliamente utilizadas en campos como la decisión clínica, biología de sistemas, virus de inmunodeficiencia humana (VIH) e investigación en influenza, análisis de sistemas de enfermedades complejos, interacciones entre múltiples enfermedades y, también, en enfermedades de diagnóstico. Este estudio tiene como objetivo mostrar la utilidad de las redes Bayesianas en estudios epidemiológicos. Material y Métodos: 3,993 individuos (hombres 1,758, mujeres 2,235) pertenecientes al sector productivo público de las Islas Baleares (España), los cuales eran trabajadores activos, constituyen la base de datos. Resultados: Una red Bayesiana se ha obtenido a partir de una base de datos compuesta de doce características relevantes de la epidemiología de la enfermedad cardiovascular. Por otra parte, la estructura y los parámetros se han obtenido con la herramienta Genie 2.0. Teniendo en cuenta las principales propiedades topológicas algunas características fueron optimizadas. Conclusiones: Las redes Bayesianas permiten obtener un escenario hipotético donde las probabilidades de las diferentes características se van actualizando de acuerdo con la evidencia introducida. Este hecho hace de las redes Bayesianas una herramienta muy atractiva, además permite establecer diversas conclusiones

    Similar works