3 research outputs found

    Contents

    Get PDF

    Forecasting of uv-vis spectrometry time series for online water quality monitoring in operating urban sewer systems

    Get PDF
    El monitoreo de contaminantes en sistemas de saneamiento urbano es generalmente realizado por medio de campa帽as de muestreo, las muestras deben ser transportadas, almacenadas y analizadas en laboratorio. Sin embargo, los desarrollos en 贸ptica y electr贸nica han permitido su fusi贸n y aplicaci贸n en la espectrometr铆a UV-Vis. Los sensores UV-Vis tienen como prop贸sito determinar la din谩mica de las cargas de materia org谩nica (Demanda Qu铆mica de Oxigeno DQO y Demanda Bioqu铆mica de Oxigeno DBO5), nitratos, nitritos y S贸lidos Suspendidos Totales (SST). Adicionalmente a los m茅todos aplicados para la calibraci贸n de los sensores y el an谩lisis las series de tiempo de los espectros de absorbancias UV-Vis, es necesario desarrollar m茅todos de pron贸stico con el fin de ser utilizada en control de monitoreo en l铆nea en tiempo real. La informaci贸n proveniente de los datos recolectados puede ser utilizada para la toma de decisiones y en aplicaciones de control de tiempo real. Realizar pron贸sticos es importante en procesos de toma de decisiones. Por lo tanto, el objetivo de este trabajo de investigaci贸n fue desarrollar uno o varios m茅todos de pron贸stico que puedan ser aplicados a series de tiempo de espectrometr铆a UV-Vis para el monitoreo en l铆nea de la calidad de agua en sistemas urbanos de saneamiento en operaci贸n. Cinco series de tiempo de absorbancia UV-Vis obtenidas en l铆nea en diferentes sitios fueron utilizadas, con un total de 5705 espectros de absorbancia UV-Vis: cuatro sitios experimentales en Colombia (Planta de Tratamiento de Aguas Residuales (PTAR) El-Salitre, PTAR San Fernando, Estaci贸n Elevadora de Gibraltar y un Humedal Construido/Tanque de Almacenamiento) y un sitio en Austria (Graz-West R05 Catchment outlet). El proceso propuesto completo consta de etapas a ser aplicadas a las series de tiempo de absorbancia UV-Vis y son: (i) entradas, series de tiempo de absorbancia UV-Vis,(ii) pre-procesamiento de las series de tiempo, an谩lisis de outliers, completar los valores ausentes y reducci贸n de la dimensionalidad,y (iii) procedimientos de pron贸stico y evaluaci贸n de los resultados. La metodolog铆a propuesta fue aplicada a la series de tiempo con diferentes caracter铆sticas (absorbancia), esta consiste del enventaneo Winsorising como paso para la remoci贸n de outliers y la aplicaci贸n de la transformada discreta de Fourier (DFT) para reemplazar valores ausentes. Los nuevos valores reemplazando o los outliers o los valores ausentes presentan la misma o al menos la misma forma de la serie de tiempo original, permitiendo una visi贸n macro en la coherencia de la serie de tiempo. La reducci贸n de la dimensionalidad en las series de tiempo de absorbancia multivariadas permite obtener menor n煤mero de variables a ser procesadas: el an谩lisis por componentes principales (PCA) como transformaci贸n lineal captura m谩s del 97% de la variabilidad en cada serie de tiempo (en un rango de una a seis, dependiendo del comportamiento de la series de tiempo absorbancia) y el proceso de Clustering (k-means) combinado con cadenas de Markov. Los procedimientos de pron贸stico basados en se帽ales peri贸dicas como la DFT, Chebyshev, Legendre y Regresi贸n Polinomial fueron aplicados y estos pueden capturar el comportamiento din谩mico de las series de tiempo. Algunas t茅cnicas de aprendizaje de m谩quina fueron probadas y fue posible capturar el comportamiento de las series de tiempo en la etapa de calibraci贸n, los valores de pron贸stico pueden seguir el comportamiento general comparado con los valores observados (excepto ANFIS, GA y Filtro de Kalman). Por lo tanto, ANN y SVM tiene buen rendimiento de pron贸stico para la primer parte del horizonte de pron贸stico (2 horas). La evaluaci贸n de cada metodolog铆a de pron贸stico fue realizada utilizando cuatro indicadores estad铆sticos tales como porcentaje absoluto de error (APE), incertidumbre extendida (EU), conjunto de valores dentro del intervalo de confianza (CI) y suma de valores de incertidumbre extendida m谩s el conjunto de valores dentro del intervalo de confianza. El rendimiento de los indicadores provee informaci贸n acerca de los resultados de pron贸stico multivariado con el fin de estimar y evaluar los tiempos de pron贸stico para cierta metodolog铆a de pron贸stico y determinar cu谩l metodolog铆a de pron贸stico es mejor adaptada a diferentes rangos de longitudes de onda (espectros de absorbancia) para cada serie de tiempo de absorbancia UV-Vis en cada sitio de estudio. Los resultados en la comparaci贸n de las diferentes metodolog铆as de pron贸stico, resaltan que no es posible obtener la mejor metodolog铆a de pron贸stico, porque todas las metodolog铆as de pron贸stico propuestas podr铆an generar un amplio n煤mero de valores que permitir谩n complementar cada una con las otras para diferentes pasos de tiempo de pron贸stico y en diferentes rangos del espectro (UV y/o Vis). Por lo tanto, es propuesto un sistema h铆brido que es basado en siete metodolog铆as de pron贸stico. As铆, los valores de los espectros de absorbancia pronosticados fueron transformados a los correspondientes indicadores de calidad de agua (WQI) para utilizaci贸n en la pr谩ctica. Los resultados de pron贸stico multivariado presentan valores bajos de APE comparados con los resultados de pron贸stico univariado utilizando directamente los valores WQI observados. Estos resultados, probablemente, son obtenidos porque el pron贸stico multivariado incluye la correlaci贸n presente en todo el rango de los espectros de absorbancia (se captura de forma completa o al menos gran parte de la variabilidad de las series de tiempo),una longitud de onda interfiere con otra u otras longitudes de onda. Finalmente, los resultados obtenidos para el humedal construido/tanque de almacenamiento presentan que es posible obtener apreciables resultados de pron贸stico en t茅rminos de tiempos de detecci贸n para eventos de lluvia. Adicionalmente, la inclusi贸n de variables como escorrent铆a (nivel de agua para este caso) mejora substancialmente los resultados de pron贸stico de la calidad del agua. El monitoreo de contaminantes en sistemas de saneamiento urbano es generalmente realizado por medio de campa帽as de muestreo, las muestras deben ser transportadas, almacenadas y analizadas en laboratorio. Sin embargo, los desarrollos en 贸ptica y electr贸nica han permitido su fusi贸n y aplicaci贸n en la espectrometr铆a UV-Vis. Los sensores UV-Vis tienen como prop贸sito determinar la din谩mica de las cargas de materia org谩nica (Demanda Qu铆mica de Oxigeno DQO y Demanda Bioqu铆mica de Oxigeno DBO5), nitratos, nitritos y S贸lidos Suspendidos Totales (SST). Adicionalmente a los m茅todos aplicados para la calibraci贸n de los sensores y el an谩lisis las series de tiempo de los espectros de absorbancias UV-Vis, es necesario desarrollar m茅todos de pron贸stico con el fin de ser utilizada en control de monitoreo en l铆nea en tiempo real. La informaci贸n proveniente de los datos recolectados puede ser utilizada para la toma de decisiones y en aplicaciones de control de tiempo real. Realizar pron贸sticos es importante en procesos de toma de decisiones. Por lo tanto, el objetivo de este trabajo de investigaci贸n fue desarrollar uno o varios m茅todos de pron贸stico que puedan ser aplicados a series de tiempo de espectrometr铆a UV-Vis para el monitoreo en l铆nea de la calidad de agua en sistemas urbanos de saneamiento en operaci贸n. Cinco series de tiempo de absorbancia UV-Vis obtenidas en l铆nea en diferentes sitios fueron utilizadas, con un total de 5705 espectros de absorbancia UV-Vis: cuatro sitios experimentales en Colombia (Planta de Tratamiento de Aguas Residuales (PTAR) El-Salitre, PTAR San Fernando, Estaci贸n Elevadora de Gibraltar y un Humedal Construido/Tanque de Almacenamiento) y un sitio en Austria (Graz-West R05 Catchment outlet). El proceso propuesto completo consta de etapas a ser aplicadas a las series de tiempo de absorbancia UV-Vis y son: (i) entradas, series de tiempo de absorbancia UV-Vis,(ii) pre-procesamiento de las series de tiempo, an谩lisis de outliers, completar los valores ausentes y reducci贸n de la dimensionalidad,y (iii) procedimientos de pron贸stico y evaluaci贸n de los resultados. La metodolog铆a propuesta fue aplicada a la series de tiempo con diferentes caracter铆sticas (absorbancia), esta consiste del enventaneo Winsorising como paso para la remoci贸n de outliers y la aplicaci贸n de la transformada discreta de Fourier (DFT) para reemplazar valores ausentes. Los nuevos valores reemplazando o los outliers o los valores ausentes presentan la misma o al menos la misma forma de la serie de tiempo original, permitiendo una visi贸n macro en la coherencia de la serie de tiempo. La reducci贸n de la dimensionalidad en las series de tiempo de absorbancia multivariadas permite obtener menor n煤mero de variables a ser procesadas: el an谩lisis por componentes principales (PCA) como transformaci贸n lineal captura m谩s del 97% de la variabilidad en cada serie de tiempo (en un rango de una a seis, dependiendo del comportamiento de la series de tiempo absorbancia) y el proceso de Clustering (k-means) combinado con cadenas de Markov. Los procedimientos de pron贸stico basados en se帽ales peri贸dicas como la DFT, Chebyshev, Legendre y Regresi贸n Polinomial fueron aplicados y estos pueden capturar el comportamiento din谩mico de las series de tiempo. Algunas t茅cnicas de aprendizaje de m谩quina fueron probadas y fue posible capturar el comportamiento de las series de tiempo en la etapa de calibraci贸n, los valores de pron贸stico pueden seguir el comportamiento general comparado con los valores observados (excepto ANFIS, GA y Filtro de Kalman). Por lo tanto, ANN y SVM tiene buen rendimiento de pron贸stico para la primer parte del horizonte de pron贸stico (2 horas). La evaluaci贸n de cada metodolog铆a de pron贸stico fue realizada utilizando cuatro indicadores estad铆sticos tales como porcentaje absoluto de error (APE), incertidumbre extendida (EU), conjunto de valores dentro del intervalo de confianza (CI) y suma de valores de incertidumbre extendida m谩s el conjunto de valores dentro del intervalo de confianza. El rendimiento de los indicadores provee informaci贸n acerca de los resultados de pron贸stico multivariado con el fin de estimar y evaluar los tiempos de pron贸stico para cierta metodolog铆a de pron贸stico y determinar cu谩l metodolog铆a de pron贸stico es mejor adaptada a diferentes rangos de longitudes de onda (espectros de absorbancia) para cada serie de tiempo de absorbancia UV-Vis en cada sitio de estudio. Los resultados en la comparaci贸n de las diferentes metodolog铆as de pron贸stico, resaltan que no es posible obtener la mejor metodolog铆a de pron贸stico, porque todas las metodolog铆as de pron贸stico propuestas podr铆an generar un amplio n煤mero de valores que permitir谩n complementar cada una con las otras para diferentes pasos de tiempo de pron贸stico y en diferentes rangos del espectro (UV y/o Vis). Por lo tanto, es propuesto un sistema h铆brido que es basado en siete metodolog铆as de pron贸stico. As铆, los valores de los espectros de absorbancia pronosticados fueron transformados a los correspondientes indicadores de calidad de agua (WQI) para utilizaci贸n en la pr谩ctica. Los resultados de pron贸stico multivariado presentan valores bajos de APE comparados con los resultados de pron贸stico univariado utilizando directamente los valores WQI observados. Estos resultados, probablemente, son obtenidos porque el pron贸stico multivariado incluye la correlaci贸n presente en todo el rango de los espectros de absorbancia (se captura de forma completa o al menos gran parte de la variabilidad de las series de tiempo),una longitud de onda interfiere con otra u otras longitudes de onda. Finalmente, los resultados obtenidos para el humedal construido/tanque de almacenamiento presentan que es posible obtener apreciables resultados de pron贸stico en t茅rminos de tiempos de detecci贸n para eventos de lluvia. Adicionalmente, la inclusi贸n de variables como escorrent铆a (nivel de agua para este caso) mejora substancialmente los resultados de pron贸stico de la calidad del agua.The monitoring of pollutants in urban sewer systems is generally conducted by sampling campaigns, and the resulting samples must be transported, stored and analyzed in laboratory. However, the developments in optics and electronics have enabled the merge of them into the UV-Vis Spectrometry. UV-Vis probes have the purpose of determining the dynamics of loads of organic materials (i.e. Chemical Oxygen Demand (COD) and Biochemical Oxygen Demand (BOD5)), nitrates, nitrites and Total Suspended Solids (TSS). In addition to the methods used for the calibration of the probes and the analysis of the time series of UV-Vis absorbance spectra, it is necessary to develop forecasting methods in order to use the online control monitoring in real time. The information from the collected data can also be used for decision making purposes and for real-time control applications. Forecasting is important for decision-making processes. Therefore, the objective of this research work was to develop either a forecasting method or forecasting methods applied to UV-Vis spectrometry time series data for online water quality monitoring in operating urban sewer systems. Five UV-Vis Absorbance time series collected at different on-line measurement sites were used, for a total of 5705 UV-Vis absorbance spectra data: four sites in Colombia (El-Salitre Wastewater Treatment Plant-WWTP, San Fernando WWTP, Pumping Station (PS) sewage called Gibraltar and constructed-wetland/reservoir-tank (CWRT)) and one site in Austria (Graz-West R05 Catchment outlet). The complete process proposed to be applied to UV-Vis absorbance time series has several stages and these are: (i) inputs, the UV-Vis absorbance time series,(ii) the time series pre-processing, outliers analysis, complete missing values and time series dimensionality reduction,and (iii) forecasting procedures and evaluation of results. The methodology proposed was applied to the time series with different characteristics (absorbance), this consists of Winsorising as a step in outlier removal and the application of the Discrete Fourier Transform (DFT) to complete the missing values. The new values replaced either outliers or missing values present the same, or almost the same, shape as the original time series, granted the macro vision of the time series coherence. Dimensionality reduction of multivariate absorbance time series allows to have less variables to be processed: PCA linear transformation captures more than 97% of variability for each time series (PC ranging from one to six, depending on absorbance time series behavior), and Clustering process (k-means) combined with Markov Chains. Forecasting procedures based on periodic signals as DFT, Chebyshev, Legendre and Polynomial Regression were applied and they can capture the dynamic behaviour of the time series. Several Machine Learning technics were tested and it was possible to capture the behaviour of the time series at calibration stage, the forecasting obtained val煤es can follow the general behaviour compared with observed val煤es (with exception of ANFIS, GA and Kalman Filter). Therefore, ANN and SVM have good forecasting performances for first part of forecasting horizon (2 hours). The evaluation of each forecasting methodology was done using four statistic indicators as Absolute Percentage Error (APE), Extended Uncertainty (EU), Set of observed values within Confidence Interval (CI) and sum of EU and Set of observed values within CI. The performance indicators provided valuable information about multivariate forecasting results to estimate and evaluate the forecasting time for a given forecasting methodology and determine which forecasting methodology is best suited for different wavelength ranges (absorbance spectra) at each study site s UV-Vis absorbance time series. Results from different comparison of several forecasting methodologies, highlight that there is not possibility to have a best forecasting methodology among the proposed ones, because all of them could provide a wide forecasting values that would complemented each other for different forecasting time steps and spectra range (UV and/or Vis). Therefore, it is proposed a hybrid system that is based on seven forecasting methodologies. Thus, the forecasted absorbance spectra were transformed to Water Quality Indicators (WQI) for practical uses. The multivariate forecasting results show lower APE values compared to the univariate forecasting results (APE values) using the observed WQI. These results, probably, were obtained because multivariate forecasting includes the correlation presented at whole absorbance spectra range (captures complete or at least great part of time series variability),one wavelength interferes with another and/or other wavelengths. Finally, the results obtained for a constructed-wetland/reservoir-tank system show that it is possible to obtain valuable forecasting results in terms of time detection for some rainfall events. In addition, the inclusion of runoff variables (water level in this case) improves the water quality forecasting results.Doctor en Ingenier铆aDoctorad
    corecore