Assessments of the Quality of the Data in Public and Private Statistics, in the Era of Big Data

Abstract

Objetivo: Describir las diferentes valoraciones respecto a la calidad de los datos en las estadísticas públicas. Se examinan los cambios producidos en la evaluación de la calidad en el marco de un aumento exponencial de la generación de los datos debido a las potencialidades del Big Data. Diseño/Metodología/Enfoque: El artículo es de carácter exploratorio. Mediante una amplia búsqueda de información especializada, se describe el conocimiento vinculado a esta problemática, desarrollada en los últimos años. Resultados/Discusión: La estructura Big Data proviene del sector privado y no fueron generadas para propósitos estadísticos. La utilización en las Oficinas de estadísticas públicas implica lidiar diferentes fuentes de invalidez y múltiples causas que afectan la calidad de los datos. Conclusiones: Los institutos de estadística han ampliado el concepto de calidad y modificado sus principios de buenas prácticas con el propósito de incluir datos no generados con fines estadísticos. En la actualidad aún se carece de una posición unificada respecto a la viabilidad del uso de los macrodatos en las estadísticas nacionales. Originalidad/Valor: El valor de las estadísticas oficiales se basa en la capacidad de generar información de calidad e imparcial para todos los agentes de la sociedad. Los avances tecnológicos de los últimos años, expresada en el Big Data y de sus disciplinas asociadas, sumado al aumento de la demanda de los usuarios de la apertura de datos, presentan nuevos retos en la evaluación de su calidad.Objective: Describe the different assessments of data quality in public statistics. It examines the changes in the assessment of quality in the context of an exponential increase in data generation due to the potential of Big Data. Design/Methodology/Approach: The article is exploratory in nature. By means of an extensive search of specialised information, it describes the knowledge linked to this problem, developed in recent years. Results/Discussion: Big Data structures come from the private sector and were not generated for statistical purposes. The use in public statistical offices involves dealing with different sources of invalidity and multiple causes that affect the quality of the data. Conclusions: Statistical institutes have broadened the concept of quality and modified their principles of good practice in order to include data not generated for statistical purposes. At present, there is still no unified position on the feasibility of using big data in national statistics. Originality/Value: The value of official statistics is based on the ability to generate quality and unbiased information for all actors in society. The technological advances of recent years, expressed in Big Data and its associated disciplines, coupled with the increased user demand for open data, present new challenges in assessing their quality.Fil: Manzano, Fernando. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Instituto de Geografía, Historia y Ciencias Sociales. Universidad Nacional del Centro de la Provincia de Buenos Aires. Instituto de Geografía, Historia y Ciencias Sociales; ArgentinaFil: Avalos, Daniela Soledad. Universidad de Buenos Aires; Argentin

    Similar works