Analysis of the effect of maritime traffic on the estimation of air quality in a port-city

Abstract

Predecir la calidad del aire es una tarea muy importante ya que se sabe que tiene un impacto significativo en la salud. La Bahía de Algeciras (España) es una zona altamente industrializada con uno de los mayores puertos de Europa. Durante el periodo 2010-2019, se registraron diferentes datos en las estaciones de monitorización de la Bahía, formando una base de datos de 131 variables de concentraciones de contaminantes atmosféricos, de información meteorológica y datos de tonelada-buque de barcos en la Bahía de Algeciras. En esta tesis se desarrolló un análisis en tres fases. La primera fase consistió en un diagnóstico de la calidad del aire, la segunda en una estimación-predicción de la calidad del aire y la tercera en una predicción de la calidad del aire. En la primera fase, el primer paso fue desarrollar un análisis en profundidad realizado durante los años 2010 a 2015 del alcance de la contaminación atmosférica en las dos principales ciudades y más pobladas de la Bahía de Algeciras (Algeciras y La Línea). Es una zona donde coexisten varios grandes focos de contaminación atmosférica como varias industrias químicas y carreteras. Además, el puerto de Algeciras es uno de los más importantes de Europa, y la ciudad de La Línea está afectada por el aeropuerto de Gibraltar, lo que contribuye al aumento de la contaminación en el Estrecho de Gibraltar. Se ha desarrollado un completo análisis estadístico para conocer aspectos relevantes de la contaminación atmosférica en este escenario concreto. Por un lado, los valores medios de concentración más elevados se obtuvieron en Algeciras para NO2 (28,850 μg/m3 ) y en La Línea para SO2 (11,966 μg/m3 ) y PM10 (30,745 μg/m3 ). El análisis mostró patrones que coinciden con la actividad humana. Por otra parte, se desarrolló un cálculo de riesgos relativos que mostró que la humedad relativa, la velocidad del viento y la dirección del viento producen un aumento del riesgo de mayores concentraciones de contaminantes. Además, los resultados obtenidos mostraron que la velocidad y la dirección del viento son las variables más importantes en la distribución de partículas. En la segunda fase, el objetivo era obtener predicciones fiables de las concentraciones de contaminantes relacionados con el tráfico marítimo (SO2, PM10, NO2, NOX y, NO) durante los años 2017 a 2019. Se analizaron tres escenarios diferentes de la Bahía de Algeciras que fueron las localizaciones del Parque de los Alcornocales, así como las ciudades de La Línea y Algeciras. Estos escenarios permitieron comparar los resultados entre ellos. El objetivo fue predecir los niveles futuros de calidad del aire de los principales contaminantes relacionados con el tráfico marítimo en la Bahía de Algeciras en función del resto de contaminantes, las xvii variables meteorológicas y, una base de datos de buques. Se diseñó un procedimiento de remuestreo aleatorio utilizando un procedimiento de 5-CV (5-validación cruzada) y 20 repeticiones en cada experimento para asegurar la capacidad de generalización de los modelos probados, para calcular las predicciones de contaminantes con diferentes modelos de clasificación (incluyendo árboles de decisión, máquinas de soporte vectorial, ensembles, entre otros) y también con redes neuronales artificiales (RNAs) utilizando diferentes números de capas y unidades ocultas. El procedimiento propuesto de remuestreo aleatorio permite realizar comparaciones múltiples adecuadas y robustas de los modelos y permitió seleccionar un grupo de los mejores modelos de predicción. Los modelos se compararon utilizando varios índices de calidad de la clasificación, como la sensibilidad, la especificidad, la exactitud y la precisión. También se utilizó la distancia (d1) al clasificador perfecto (1, 1, 1, 1) como característica discriminante, para seleccionar los mejores modelos. Además, se realizó un análisis de relevancia para conocer qué variables son las más importantes para cada contaminante y se diseñaron modelos con menor número de entradas en una red de monitorización más óptima. Las sensibilidades obtenidas en los mejores modelos fueron de 0,98 para SO2, 0,97 para PM10, 0,82 para NO2 y NOX, y 0,83 para NO. Los resultados obtenidos demuestran el potencial de los modelos para predecir la contaminación en una ciudad portuaria o en un escenario de contaminación atmosférica complejo. En la tercera fase, se predijeron los datos disponibles durante los años 2017 a 2019 en la estación de Algeciras utilizando modelos de Long-Short Term Memory (LSTM). Se desarrollaron cuatro enfoques diferentes para realizar previsiones de SO2 y NO2 a 1 hora y a 4 horas en Algeciras. El primero utiliza las 130 variables exógenas restantes. El segundo utiliza únicamente los datos de series temporales sin variables exógenas. El tercer enfoque consiste en utilizar un arreglo de series temporales autorregresivas como entrada y el cuarto es similar utilizando las series temporales junto con datos de viento y barcos. Los resultados mostraron que el SO2 se predice mejor con información autorregresiva y el NO2 se predice mejor con series temporales autorregresivas de barcos y viento, lo que indica que el NO2 está estrechamente relacionado con los motores de combustión y puede predecirse mejor. Uno de los objetivos de esta tesis doctoral es desarrollar un sensor virtual útil capaz de conseguir una red de vigilancia más robusta, que pueda utilizarse en caso de datos faltantes. Además, puede servir como sistema de apoyo a la toma de decisiones por parte de las autoridades, que podría ser utilizado por los ciudadanos para prevenir la exposición a contaminantes y por las empresas para tomar decisiones sobre la calidad del aire.Predicting air quality is a very important task as it is known to have a significant impact on health. The Bay of Algeciras (Spain) is a highly industrialised area with one of the largest super-ports in Europe. During the period 2010-2019, different data were recorded in the monitoring stations of the Bay, forming a database of 131 variables (air pollutants, meteorological information, and vessel data). A three stage analysis was developed in this Thesis. The first stage was an air quality diagnosis, the second stage was an estimation-prediction of the air quality, and the third stage was an air quality forecasting. In the first stage, the first step was to develop an in-depth analysis accomplished during the years 2010 to 2015 of the scope of pollution in the two main cities of the Bay of Algeciras (Algeciras and La Línea). Surrounded by several industries and roads, this area is highly polluted. Besides, Algeciras port is one of the most important ports in Europe, and La Línea city is affected by Gibraltar airport, which contributes to the increase of air pollution in The Strait of Gibraltar. A complete statistical analysis was developed in order to gain knowledge about relevant aspects of air pollution in this particular scenario. On the one hand, the higher average concentration values were obtained in Algeciras for NO2 (28.850 μg/m3 ) and in La Línea for SO2 (11.966 μg/m3 ) and PM10 (30.745 μg/m3 ). The analysis showed patterns that coincide with human activity. On the other hand, a calculation of relative risks was developed showing that relative humidity, wind speed and wind direction produce an increase in the risk of higher pollutant concentrations. Besides, obtained results showed that wind speed and wind direction are the most important variables in the distribution of particles. In the second stage, the objective was to obtain reliable predictions of pollutant concentrations related to maritime traffic (SO2, PM10, NO2, NOX and, NO) during the years 2017 to 2019. Three scenarios were analysed which involve the locations of Alcornocales Park, as well as the cities of La Línea and Algeciras. These scenarios allowed us to compare the results. The objective was to predict future air quality levels of the principal maritime traffic-related pollutants in the Bay of Algeciras as a function of the rest of the pollutants, the meteorological variables and, a vessel database. A randomised resampling procedure was designed using a 5-fold cross-validation procedure and 20 repetitions in each experiment to ensure the generalisation capabilities of the tested models to compute the pollutant xix predictions with different classification models (including Trees, Ensembles, SVM, among others) and also with artificial neural networks (ANNs) using different numbers of hidden layers and units. The proposed procedure of random resampling permits adequate and robust multiple comparisons of the tested models and allowed us to select a group of best prediction models. The models were compared using several quality classification indexes such as sensitivity, specificity, accuracy, and precision. The distance (d1) to the perfect classifier (1, 1, 1, 1) was also used as a discriminant feature, which allowed us to select the best models. Furthermore, a relevance analysis was performed in order to know which variables are the most relevant to each pollutant and to design models with less number of inputs in a more optimal monitoring network. These models seem to be the best in a number of scenarios. The obtained sensibilities in the best models were 0.98 for SO2, 0.97 for PM10, 0.82 for NO2 and NOX, and 0.83 for NO. The obtained results demonstrate the potential of the models to forecast air pollution in a port city or a complex scenario. The third stage, data available during the years 2017 to 2019 were predicted in the Algeciras station using Long-Short Term Memory (LSTM) models. Four different approaches have been developed to make SO2 and NO2 forecasts 1h and 4h in Algeciras. The first uses the remaining 130 exogenous variables. The second uses only the time series data without exogenous variables. The third approach consists of using an autoregressive time series arrangement as input and the fourth one is similar using the time series together with wind and ship data. The results showed that SO2 is better predicted with autoregressive information and NO2 is better predicted with ships and wind autoregressive time series, indicating that NO2 is closely related to combustion engines and can be better predicted. One of the goals of this Thesis is to develop a useful virtual sensor capable of achieving a more robust monitoring network, which can be used, for instance, in the case of missing data. Besides, it can serve as a decision support system for authorities, that could be used by citizens to prevent exposure to pollutants and companies to make air quality decisions.233 página

    Similar works