4 research outputs found

    A comparison of nonlinear population Monte Carlo and particle Markov chain Monte Carlo algorithms for Bayesian inference in stochastic kinetic models

    Get PDF
    Documento depositado en el repositorio arXiv.org. Versión: arXiv:1404.5218v1 [stat.ME]In this paper we address the problem of Monte Carlo approximation of posterior probability distributions in stochastic kinetic models (SKMs). SKMs are multivariate Markov jump processes that model the interactions among species in biochemical systems according to a set of uncertain parameters. Markov chain Monte Carlo (MCMC) methods have been typically preferred for this Bayesian inference problem. Specifically, the particle MCMC (pMCMC) method has been recently shown to be an effective, while computationally demanding, method applicable to this problem. Within the pMCMC framework, importance sampling (IS) has been used only as the basis of the sequential Monte Carlo (SMC) approximation of the acceptance ratio in the Metropolis-Hastings kernel. However, the recently proposed nonlinear population Monte Carlo (NPMC) algorithm, based on an iterative IS scheme, has also been shown to be effective as a Bayesian inference tool for low dimensional (predator-prey) SKMs. In this paper, we provide an extensive performance comparison of pMCMC versus NPMC, when applied to the challenging prokaryotic autoregulatory network. We show how the NPMC method can greatly outperform the pMCMC algorithm in this scenario, with an overall moderate computational effort. We complement the numerical comparison of the two techniques with an asymptotic convergence analysis of the nonlinear IS scheme at the core of the proposed method when the importance weights can only be computed approximatelyE. K. acknowledges the support of Ministerio de Educacióon of Spain ( Programa de Formación de Profesorado Universitario , ref. AP2008-00469). This work has been partially supported by Ministerio de Economía y Competitividad of Spain (program Consolider-Ingenio 2010 CSD2008-00010 COMONSENS and project COMPREHENSION TEC2012-38883-C02-01)

    Micro-database for sustainability (ESG) indicators developed at the Banco de España (2022)

    Get PDF
    En los últimos años, la preocupación por los temas sociales y medioambientales ha ido en aumento y, en consecuencia, la demanda de datos sobre sostenibilidad se ha incrementado exponencialmente. Por esta razón, se ha desarrollado en el Departamento de Estadística del Banco de España una base de microdatos sobre indicadores de sostenibilidad (ESG). Este documento presenta dos artículos que analizan el proceso desarrollado para capturar esta información, así como las numerosas limitaciones y dificultades encontradas a lo largo del camino de búsqueda de microdatos sobre sostenibilidad. Concretamente, los dos temas que tratan los artículos son: “Analysing climate change data gaps” (presentado en la 11th Biennial IFC Conference on “Post-pandemic landscape for central bank statistics” durante los días 25-27 de agosto de 2022 en la sesión 3.B “Environmental statistics”) “Creation of a structured sustainability database from company reports: A web application prototype for information retrieval and storage” (presentado en el IFC Bank of Italy workshop on “Data science in central banking” los días 14-17 de febrero de 2022 en la sesión 4.3 “Text Mining and ML utilized in Economic Research”) (Koblents and Morales (2022)) El primer artículo se centra en las numerosas limitaciones encontradas y logros conseguidos en el proceso de desarrollo de la base de microdatos sobre indicadores de sostenibilidad para sociedades no financieras. Tras analizar detalladamente los estándares actuales de información ESG, consultar a expertos en la materia, analizar las obligaciones regulatorias y llevar a cabo un ejercicio práctico de búsqueda de esta información, se seleccionó una lista de los 39 indicadores más relevantes para comenzar la búsqueda. Actualmente se han recopilado más de 15.000 datos correspondientes al período 2019-2020 utilizando una herramienta semiautomática de búsqueda de información desarrollada internamente (presentado en detalle en el segundo artículo). Durante el proyecto se identificaron numerosas dificultades tales como el uso de diferentes métricas al reportar los indicadores, falta de información y de soporte digital para la descarga, así como dificultades de comparabilidad y restricciones regulatorias. El segundo artículo se centra en la herramienta desarrollada para crear la base de microdatos presentada en el primer artículo. Esta aplicación web tiene como objetivo, mediante la extracción y almacenamiento semiautomático, obtener los indicadores de sostenibilidad de los estados no financieros anuales presentados por las sociedades no financieras españolas. El objetivo de la aplicación es facilitar a los usuarios el trabajo de búsqueda de indicadores de sostenibilidad en múltiples documentos y su almacenamiento en una base de datos estructurada. La herramienta desarrollada incorpora un conjunto de términos de búsqueda predefinidos para cada indicador que han sido seleccionados en base a conocimiento experto e inteligencia artificial en desarrollos posteriores. Para cada empresa e indicador, la herramienta sugiere los fragmentos de texto más relevantes al usuario, quien a su vez identifica el valor correcto del indicador y lo almacena en la base de datos utilizando la interfaz web de usuario. Esta herramienta ha sido creada por dos científicos de datos en tres meses, con el apoyo continuo de un equipo de expertos que ha contribuido a la definición de requisitos y propuestas de mejora, la recopilación de datos, así como la validación y prueba de la herramienta. A lo largo del artículo, se realiza una descripción del enfoque técnico y los principales módulos del prototipo implementado, incluyendo la extracción de texto, indexación y búsqueda, almacenamiento de datos y visualización

    A nonlinear population Monte Carlo scheme for the Bayesian estimation of parameters of alpha-stable distributions

    Get PDF
    The class of alpha-stable distributions enjoys multiple practical applications in signal processing, finance, biology and other areas because it allows to describe interesting and complex data patterns, such as asymmetry or heavy tails, in contrast with the simpler and widely used Gaussian distribution. The density associated with a general alpha-stable distribution cannot be obtained in closed form, which hinders the process of estimating its parameters. A nonlinear population Monte Carlo (NPMC) scheme is applied in order to approximate the posterior probability distribution of the parameters of an alpha-stable random variable given a set of random realizations of the latter. The approximate posterior distribution is computed by way of an iterative algorithm and it consists of a collection of samples in the parameter space with associated nonlinearly-transformed importance weights. A numerical comparison of the main existing methods to estimate the alpha-stable parameters is provided, including the traditional frequentist techniques as well as a Markov chain Monte Carlo (MCMC) and a likelihood-free Bayesian approach. It is shown by means of computer simulations that the NPMC method outperforms the existing techniques in terms of parameter estimation error and failure rate for the whole range of values of a, including the smaller values for which most existing methods fail to work properly. Furthermore, it is shown that accurate parameter estimates can often be computed based on a low number of observations. Additionally, numerical results based on a set of real fish displacement data are providedE.K. acknowledges the support of Ministerio de Educación of Spain (Programa de Formación de Profesorado Universitario, Ref. AP2008-00469). J.M. acknowledges the partial support of Ministerio de Economía y Competitividad of Spain (program Consolider-Ingenio 2010 CSD2008-00010 COMONSENS and project COMPREHENSION TEC2012-38883-C02-01) and the Office of Naval Research Global (award no. N62909-15-1-2011). At the time of the original submission of this paper, J.M. was with the Department of Signal Theory and Communications, Universidad Carlos III de Madrid (Spain). M.A acknowledges the financial support of the Natural Sciences and Engineering Council of Canada (Discovery Grant 138680), the Coordenação de Apoioao Pessoal do Ensino Superior (grant No.1351/11-7) and the Fundação de Amparo à Pesquisado Estado do Rio de Janeiro (grant No.E-26/110.864/2012), and thanks J. Nolan for providing a free copy of the STABLE software. A.M.S. acknowledges the financial support from Conselho Nacional de Desenvolvimento Científico e Tecnológico(grant No. 308016/2014-9) and Coordenação de Apoio ao Pessoal do Ensino Superior, DGU Program (grant No. 257/12)

    Evidence recommendation in forensics based on cyclic meta-paths in heterogeneous information networks

    Full text link
    In this article we propose a novel approach for evidence recommendation in digital forensic applications. The so-called Evidence Graph (EG) is a Heterogeneous Information Network (HIN) constructed from entities and relationships extracted from large collections of low quality video footage, collected by surveillance cameras in relation to a crime. The EG has been developed in the context of the EU-funded project LASIE. It presents multiple types of nodes and edges and a generic network schema in which all types of nodes can be connected. In this work, relevant cyclic meta-paths are identified and an iterative scheme for evidence recommendation is proposed and evaluated on real data
    corecore