Search CORE

3 research outputs found

Soft Computing Techniques Applied to a Case Study of Air Quality in Industrial Areas in the Czech Republic

Author: Arroyo Puente Ángel
Corchado Rodríguez Emilio Santiago
García Hernández Laura
Snášel Václav
Tricio Verónica
Publication venue: Springer Science + Business Media
Publication date: 01/01/2013
Field of study

This multidisciplinary research analyzes the atmospheric pollution conditions of two different places in Czech Republic. The case study is based on real data provided by the Czech Hydrometeorological Institute along the period between 2006 and 2010. Seven variables with atmospheric pollution information are considered. Different Soft Computing models are applied to reduce the dimensionality of this data set and show the variability of the atmospheric pollution conditions among the two places selected, as well as the significant variability of the air quality along the time

Técnicas inteligentes para el análisis de condiciones medioambientales

Author: Arroyo Puente Ángel
Publication venue
Publication date: 01/01/2017
Field of study

[ES] Como es bien sabido, la calidad del aire es un tema importante y preocupante en la actualidad que afecta no solamente a la salud humana sino a otros muchos aspectos como el cambio climático o la supervivencia de la biosfera. En los últimos años, numerosas entidades públicas se han ido adaptando a las restrictivas medidas de contaminación ambiental impuestas por las diversas normativas europeas, siendo España uno de los países obligados a cumplir estas normativas. Tanto en España como en otros países existen diversas redes de monitorización de la calidad del aire y de adquisición de valores meteorológicos de una forma continua. Estas redes de estaciones de medida no sólo están presentes en las grandes ciudades sino también en zonas periféricas, polígonos industriales y en zonas donde la preservación de la naturaleza es fundamental. Además, están sometidas a constantes procesos de reordenación para mejorar su función. En la presente Tesis Doctoral se han aplicado diversas técnicas inteligentes (Soft Computing más específicamente) a conjuntos de datos públicos con información meteorológica y/o de calidad del aire. Las técnicas aplicadas llevan a cabo fundamentalmente dos tareas: reducción de la dimensionalidad y agrupamiento (clustering). Estas se han aplicado de forma aislada y de forma combinada para mejorar los resultados obtenidos en el análisis de la información medioambiental. Las técnicas de reducción de la dimensionalidad aplicadas son: Principal Component Analysis (PCA) como técnica aplicada en primer lugar para obtener una primera aproximación a la estructura del conjunto de datos, Locally Linear Embedding (LLE) como técnica no lineal local, Maximum Likelihood Hebbian Learning (MLHL) y Cooperative Maximum Likelihood Hebbian Learning (CMLHL) como modelos neuronales que implementan Exploratory Projection Pursuit, Curvilinear Component Analysis (CCA) como modelo no lineal que intenta preservar la distancia entre los puntos en la salida, Multidimensional Scalling (MDS) como técnica global no lineal basada en la matriz de distancias, Isometric Mapping (ISOMAP) como técnica derivada de MDS y los Self-Organizing Maps (SOM), un importante modelo neuronal que implementa aprendizaje competitivo. Las técnicas de agrupamiento aplicadas han sido por una lado particionales: k-means como primer método a aplicar en agrupamiento y que busca la asignación de muestras a grupos aplicando métricas de distancia, SOM k-means que utiliza los algoritmos de SOM para la actualización de los pesos, k-medoids como técnica derivada de k-means y que asigna el centroide de cada grupo a uno de los puntos del mismo y fuzzy c-means, técnica que aplica lógica difusa para tareas de agrupamiento. Por otro lado, también se ha empleado el método aglomerativo jerárquico en el que se van formando los grupos de forma ascendente, junto con diversos métodos de evaluación de agrupamiento que sirven para determinar el posible número de grupos existentes en un conjunto de datos y dendrogramas para obtener una representación gráfica de la agrupación de los datos en forma de árbol. Los casos de estudio han sido cuidadosamente seleccionados y se extienden desde el ámbito local, regional hasta el nacional. Por otra parte, también se ha dado importancia a los periodos de tiempo seleccionados. En alguno de los estudios se analizan periodos de tiempo tan cortos como un día para el análisis de la meteorología/calidad del aire en un breve periodo de tiempo en un lugar determinado, mientras que en otros se emplean ventanas temporales próximas a una década y en los puntos más representativos climatológicamente en España. Partiendo de uno o más conjuntos de datos públicos con la información más completa posible acerca de las condiciones medioambientales (meteorológica, de calidad del aire o ambas), pero siempre analizando variables determinantes en la caracterización de las condiciones medioambientales, el objetivo es extraer la información fundamental almacenada en los conjuntos de datos mediante las técnicas inteligentes. De esta forma es posible analizar las condiciones medioambientales en los casos de estudio seleccionados. En cada uno de los casos de estudio se hace un análisis de la situación meteorológica o de calidad del aire en las localizaciones y periodos seleccionados, buscando semejanzas y diferencias en las muestras de datos analizadas y haciendo énfasis en aquellas situaciones anómalas detectadas y tratando de dar explicación a las mismas. También se hace un análisis comparativo de los resultados obtenidos con las distintas técnicas empleadas, planteando las ventajas e inconvenientes del uso de cada uno de ellas en cada caso de estudio. Las técnicas de reducción de la dimensionalidad resultan de gran utilidad para analizar gráficamente conjuntos de datos multidimensionales, encontrar relaciones en los datos y detectar situaciones anómalas. De manera complementaria, las técnicas de agrupamiento revelan la estructura de un conjunto de datos asignando las muestras de datos a los distintos grupos en función de las medidas de distancias y similitud aplicadas. Esto resulta de gran utilidad en el presente trabajo para entender las semejanzas y diferencias en la meteorología y/o calidad del aire de los distintos puntos seleccionados en cada caso de estudio. [EN] It is well known that air quality is an important and worrying issue nowadays, affecting not only human health but also many other aspects such as climate change or the survival of the biosphere. In recent years, many public institutions have been adapted to the restrictive normative about environmental pollution imposed by European regulations, being Spain one of the countries that must comply with these regulations. Both in Spain and in other countries there are various air-quality networks and stations for the continuous acquisition of meteorological parameters. These networks are not only present in big cities, but also in peripheral and industrial areas, as well as in places where the preservation of nature is fundamental key issue. Furthermore, they are constantly rearranged to improve their function. In present PhD Thesis, different intelligent techniques (more specifically, Soft Computing techniques) have been applied to publicly available databases with air quality and/or meteorological information. The applied techniques perform two fundamental tasks: dimensionality reduction and clustering. They have been applied in isolation and in conjunction in order to improve the results in the analysis of environmental conditions. The applied dimensionality reductions techniques are: Principal Component Analysis (PCA) as the technique firstly applied to obtain an approximation to the dataset structure, Locally Linear Embedding (LLE) as a non-linear local technique, Maximum Likelihood Hebbian Learning (MLHL) and Cooperative Maximum Likelihood Hebbian Learning (CMLHL) as neural models which implement Exploratory Projection Pursuit, Curvilinear Component Analysis (CCA) as a non-linear technique which tries to preserve the interpoint distance in the output space, Multidimensional Scalling (MDS) as a non-linear global technique operating with the distance matrix, Isometric Mapping (ISOMAP) as a technique derived from MDS and Self-Organizing Maps (SOM), as a competitive learning neural model. The applied clustering techniques are, on the one hand partitional techniques: k-means as the clustering technique firstly applied, which assigns samples to groups using distance metrics, SOM k-means which use the SOM algorithm for the weight updating process, k-medoids as a k-means derived technique which assigns the centroid of each cluster to one of the belonging samples, and fuzzy c-means as a fuzzy-logic based technique for grouping samples. On the other hand, hierarchical agglomerative techniques have also been applied (where groups are formed in an ascending way) together with different clustering evaluation indexes, used to determine the possible number of existing groups in a dataset, and finally dendrograms for a tree-form graphical representation of clustering. Case studies have been carefully selected and range from local, regional to national contexts. Similarly, the selected periods of time have also been a priority. In some of the studies, the analyzed period of time is one day long, considered for the analysis of meteorological / air quality in a short time interval in a certain place, while in other cases, long periods of time (close to a decade), are used to analyze some of the most climatological representative places in Spain. From one or more public datasets comprising all the information about environmental conditions (weather, air quality, or both), but always analyzing key variables in the characterization of environmental conditions, the goal is to extract the meaningfully information in the datasets by applying intelligent techniques. This leads to an analysis of the environmental conditions in the selected case studies. In each case study, an analysis of the weather or air quality conditions is carried out in the selected places and periods of time, searching for similarities and differences in the analyzed data samples, emphasizing those detected anomalous situations and trying to give an explanation to these phenomena’s. A comparative analysis of the results obtained with the different techniques applied is also performed, considering the advantages and disadvantages of using each of them in each case study Dimensionality reduction techniques are useful for graphically analyzing high-dimensional data sets, find relationships in datasets and detect anomalous situations. Complementarily, clustering techniques reveal the structure of datasets by assigning the data samples to different clusters depending on the applied distance and similarity measures. This is useful in present work to understand the similarities and differences in the meteorological and / or air quality conditions of the different locations selected in each case study