Skip to main content
Article thumbnail
Location of Repository

Estimaciones usadas en diseños muestrales complejos: aplicaciones en la encuesta de salud cubana del año 2001 Estimate methods used with complex sampling designs: their application in the Cuban 2001 health survey

By Mayilée Cañizares Pérez, Isabel Barroso Utra, Alina Alfonso León, René García Roche, Karen Alfonso Sagué, Martha Chang de la Rosa, Mariano Bonet Gorbea and Esther M. León

Abstract

OBJETIVOS: En el presente trabajo se discuten las particularidades de tres métodos de estimación de parámetros simples -medias, totales y porcentajes, y sus respectivos errores estándar-, así como de los modelos de regresión logística, en el análisis de los datos de muestras complejas. MÉTODOS: Se tomaron los datos de la Segunda Encuesta Nacional de Factores de Riesgo y Afecciones Crónicas No Transmisibles, realizada en Cuba en el año 2001. Se usó un diseño muestral complejo estratificado y por conglomerados polietápicos. Los estratos estuvieron conformados por las 14 provincias de Cuba y el municipio especial Isla de la Juventud, mientras que los conglomerados fueron las áreas geográficas muestrales (AGEM), manzanas y secciones. Las muestras se ponderaron en proporción inversa a las probabilidades de selección y para la estimación se realizó una estratificación por sexo y grupo de edad (15-34, 35-54, 55-74 y 75 años o más). Las varianzas se estimaron mediante las aproximaciones de Taylor. Se compararon tres métodos estadísticos: el análisis convencional, que da por sentado que los datos provienen de un muestreo simple aleatorio; el análisis ponderado, que solo toma en consideración los pesos muestrales para obtener las estimaciones; y el análisis con ajustes, que toma en cuenta la desigualdad en las probabilidades de selección y el efecto de la conglomeración en los datos. RESULTADOS: Las estimaciones puntuales obtenidas mediante las tres estrategias de análisis fueron similares. Los errores estándar estimados para la prevalencia de sobrepeso obtenidos por el análisis convencional se subestimaron en 19,3% y para la prevalencia de hipertensión en más de 11,5% en relación con los otros métodos. El análisis ponderado generó valores de los errores estándar mucho menores que los calculados por otros métodos. Resultados similares se encontraron al estimar los valores de la razón de posibilidades. CONCLUSIONES: Los métodos de análisis que toman en cuenta la estructura de los datos y las características del diseño ofrecen una visión más realista del problema estudiado. Con ellos se obtienen estimaciones más precisas de los parámetros y de sus errores estándar. La frecuencia con que se encuentran datos procedentes de diseños muestrales complejos en estudios epidemiológicos y de salud pública exige una mayor utilización de estos métodos y de los paquetes estadísticos que los contemplan.<br>OBJECTIVES: To look at the individual features of three different methods used to estimate simple parameters-means, totals, and percentages, as well as their standard errors-and of logistic regression models, and to describe how such methods can be used for analyzing data obtained from complex samples. METHODS: Data from Cuba’s Second National Survey of Risk Factors and Non-Communicable Chronic Ailments [Segunda Encuesta Nacional de Factores de Riesgo y Afecciones Crónicas No Transmisibles], which was conducted in 2001, were studied. A complex, stratified multi-stage cluster sampling design was used. Cuba’s 14 provinces and the municipality of Isla de la Juventud served as the strata, while the clusters consisted of sampled geographic areas (SGA), blocks, and sectors. Samples were weighted in inverse proportion to their probability of being selected, and estimates were performed by sex and age group (15-34, 35-54, 55-74, and 75 or more years). Taylor approximations were used to estimate variances. Three statistical methods were compared: conventional analysis, which assumes all data were obtained through simple random sampling; weighted analysis, which only takes into account the weight of the samples when performing estimates; and adjusted analysis, which looks at all aspects of the sampling design (namely, the disparity in the probability of being included in the sample and the effect of clustering on the data). RESULTS: The point estimates obtained with the three different types of analytic methods were similar. Standard error (SE) estimates for the prevalence of overweight and of arterial hypertension that were obtained by conventional analysis were underestimated by 19.3% and by more than 11.5%, respectively, when such estimates were compared to those obtained with the other two analytic methods. On the other hand, weighted analysis generated SE values that were much smaller than those obtained with the other two types of analyses. The same pattern was noted when odds ratios were calculated using the different methods. CONCLUSIONS: Analytic methods that take into account the way the data are structured as well as the study design give a more realistic picture of the problem under study and provide more exact estimates of the study parameters and their SE than conventional analytic methods. Because data from epidemiologic and public health research are often obtained through complex sampling designs, the methods described in this paper and the statistical packages that utilize them should be used more widely

Topics: Diseño de investigaciones epidemiológicas, muestras, muestreo, técnicas de estimación, LCC:Public aspects of medicine, LCC:RA1-1270, LCC:Medicine, LCC:R, DOAJ:Public Health, DOAJ:Health Sciences
Publisher: Organización Panamericana de la Salud
Year: 2004
OAI identifier: oai:doaj.org/article:2db4f767fbc34d2598998617752df05d
Journal:
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • http://doaj.org/search?source=... (external link)
  • Suggested articles


    To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.