Ocorrência de substâncias químicas en sitemas de abastecimento de água do Brasil: Uma abordagem não-paramétrica para a análise estatística de dados do Sisagua

Abstract

The objective of this work was to develop a methodology for statistical analysis of monitoring data of chemical compounds in drinking water supply systems in Brazil, using data from Sisagua (Drinking Water Quality Surveillance Information System). Initially, the inconsistencies in the database were identified and adjusted. Then, the descriptive statistics were estimated using the Kaplan-Meier (KM) method, evaluating its applicability in different censored data sets. The descriptive parameters were compared with the substitution method. The substitution method showed susceptibility to biased estimates, especially for groups of compounds containing high percentage of censored data and with high limits of quantification and detection, leading to higher descriptive parameters compared to KM method. This work reinforces the need to use appropriate methods for analyzing environmental data and evidences that the analysis of this type of data may be complex. The methods proposed here can help environmental scientists to deal with this issue, providing a systematic procedure to check and solve consistency problems, as well as presenting a nonparametric approach for computing descriptive statistics for environmental monitoring data.Este estudo teve como objetivo o desenvolvimento de uma metodologia para o tratamento estatístico de dados de monitoramento de substâncias químicas em sistemas de abastecimento de água do Brasil, utilizando-se dados do SISAGUA (Sistema de Informação de Vigilância da Qualidade da Água para Consumo Humano). Propôs-se uma metodologia para a análise de consistência da base de dados, bem soluções para todas as inconsistências identificadas. Em seguida, estatísticas descritivas foram estimadas pelo método de Kaplan-Meier (KM), avaliando-se a sua aplicabilidade a diferentes proporções de dados censurados. Os parâmetros descritivos obtidos pelo método de KM foram comparados aos obtidos pelo método de substituição. De modo geral, o método de substituição demonstrou maior suscetibilidade a estimativas enviesadas, notadamente com o aumento do percentual de censura e em meio a elevados limites de quantificação e detecção, conduzindo àestimativa de parâmetros descritivos mais altos em relação aos estimados pelo método de KM. O estudo reforça a necessidade do uso de métodos apropriados para a análise de dados ambientais, além de evidenciar que o tratamento desse tipo de dado pode ser uma tarefa complexa. Dessa forma, a metodologia proposta pode ser útil a pesquisadores, uma vez que apresenta um processo sistemático de identificação e correção de inconsistências, bem como uma abordagem não paramétrica para a obtenção de estatísticas descritivas para dados de monitoramento ambiental

    Similar works