7 research outputs found

    Facial recognition techniques using SVM: A comparative analysis

    Get PDF
    This paper presents a literary review of facial recognition in 2D, which plays an important role in the life of the human being in terms of safety, work activity, etc. The focus is on the results obtained by some researchers with the application of feature extraction techniques, pattern classifiers, databases and their respective percentage of efficiency obtained. The objective is to determine efficient techniques that allow an optimal 2D facial recognition process, based on the quality of databases, feature extractors and pattern classifiers

    Eigenvector-based Dimensionality Reduction for Human Activity Recognition and Data Classification

    Get PDF
    In the context of appearance-based human motion compression, representation, and recognition, we have proposed a robust framework based on the eigenspace technique. First, the new appearance-based template matching approach which we named Motion Intensity Image for compressing a human motion video into a simple and concise, yet very expressive representation. Second, a learning strategy based on the eigenspace technique is employed for dimensionality reduction using each of PCA and FDA, while providing maximum data variance and maximum class separability, respectively. Third, a new compound eigenspace is introduced for multiple directed motion recognition that takes care also of the possible changes in scale. This method extracts two more features that are used to control the recognition process. A similarity measure, based on Euclidean distance, has been employed for matching dimensionally-reduced testing templates against a projected set of known motions templates. In the stream of nonlinear classification, we have introduced a new eigenvector-based recognition model, built upon the idea of the kernel technique. A practical study on the use of the kernel technique with 18 different functions has been carried out. We have shown in this study how crucial choosing the right kernel function is, for the success of the subsequent linear discrimination in the feature space for a particular problem. Second, building upon the theory of reproducing kernels, we have proposed a new robust nonparametric discriminant analysis approach with kernels. Our proposed technique can efficiently find a nonparametric kernel representation where linear discriminants can perform better. Data classification is achieved by integrating the linear version of the NDA with the kernel mapping. Based on the kernel trick, we have provided a new formulation for Fisher\u27s criterion, defined in terms of the Gram matrix only

    Design of Machine Learning Algorithms with Applications to Breast Cancer Detection

    Get PDF
    Machine learning is concerned with the design and development of algorithms and techniques that allow computers to 'learn' from experience with respect to some class of tasks and performance measure. One application of machine learning is to improve the accuracy and efficiency of computer-aided diagnosis systems to assist physician, radiologists, cardiologists, neuroscientists, and health-care technologists. This thesis focuses on machine learning and the applications to breast cancer detection. Emphasis is laid on preprocessing of features, pattern classification, and model selection. Before the classification task, feature selection and feature transformation may be performed to reduce the dimensionality of the features and to improve the classification performance. Genetic algorithm (GA) can be employed for feature selection based on different measures of data separability or the estimated risk of a chosen classifier. A separate nonlinear transformation can be performed by applying kernel principal component analysis and kernel partial least squares. Different classifiers are proposed in this work: The SOM-RBF network combines self-organizing maps (SOMs) and radial basis function (RBF) networks, with the RBF centers set as the weight vectors of neurons from the competitive layer of a trained SaM. The pairwise Rayleigh quotient (PRQ) classifier seeks one discriminating boundary by maximizing an unconstrained optimization objective, named as the PRQ criterion, formed with a set of pairwise const~aints instead of individual training samples. The strict 2-surface proximal (S2SP) classifier seeks two proximal planes that are not necessary parallel to fit the distribution of the samples in the original feature space or a kernel-defined feature space, by ma-ximizing two strict optimization objectives with a 'square of sum' optimization factor. Two variations of the support vector data description (SVDD) with negative samples (NSVDD) are proposed by involving different forms of slack vectors, which learn a closed spherically shaped boundary, named as the supervised compact hypersphere (SCH), around a set of samples in the target class. \Ve extend the NSVDDs to solve the multi-class classification problems based on distances between the samples and the centers of the learned SCHs in a kernel-defined feature space, using a combination of linear discriminant analysis and the nearest-neighbor rule. The problem of model selection is studied to pick the best values of the hyperparameters for a parametric classifier. To choose the optimal kernel or regularization parameters of a classifier, we investigate different criteria, such as the validation error estimate and the leave-out-out bound, as well as different optimization methods, such as grid search, gradient descent, and GA. By viewing the tuning problem of the multiple parameters of an 2-norm support vector machine (SVM) as an identification problem of a nonlinear dynamic system, we design a tuning system by employing the extended Kalman filter based on cross validation. Independent kernel optimization based on different measures of data separability are a~so investigated for different kernel-based classifiers. Numerous computer experiments using the benchmark datasets verify the theoretical results, make comparisons among the techniques in measures of classification accuracy or area under the receiver operating characteristics curve. Computational requirements, such as the computing time and the number of hyper-parameters, are also discussed. All of the presented methods are applied to breast cancer detection from fine-needle aspiration and in mammograms, as well as screening of knee-joint vibroarthrographic signals and automatic monitoring of roller bearings with vibration signals. Experimental results demonstrate the excellence of these methods with improved classification performance. For breast cancer detection, instead of only providing a binary diagnostic decision of 'malignant' or 'benign', we propose methods to assign a measure of confidence of malignancy to an individual mass, by calculating probabilities of being benign and malignant with a single classifier or a set of classifiers

    Forecasting of uv-vis spectrometry time series for online water quality monitoring in operating urban sewer systems

    Get PDF
    El monitoreo de contaminantes en sistemas de saneamiento urbano es generalmente realizado por medio de campa帽as de muestreo, las muestras deben ser transportadas, almacenadas y analizadas en laboratorio. Sin embargo, los desarrollos en 贸ptica y electr贸nica han permitido su fusi贸n y aplicaci贸n en la espectrometr铆a UV-Vis. Los sensores UV-Vis tienen como prop贸sito determinar la din谩mica de las cargas de materia org谩nica (Demanda Qu铆mica de Oxigeno DQO y Demanda Bioqu铆mica de Oxigeno DBO5), nitratos, nitritos y S贸lidos Suspendidos Totales (SST). Adicionalmente a los m茅todos aplicados para la calibraci贸n de los sensores y el an谩lisis las series de tiempo de los espectros de absorbancias UV-Vis, es necesario desarrollar m茅todos de pron贸stico con el fin de ser utilizada en control de monitoreo en l铆nea en tiempo real. La informaci贸n proveniente de los datos recolectados puede ser utilizada para la toma de decisiones y en aplicaciones de control de tiempo real. Realizar pron贸sticos es importante en procesos de toma de decisiones. Por lo tanto, el objetivo de este trabajo de investigaci贸n fue desarrollar uno o varios m茅todos de pron贸stico que puedan ser aplicados a series de tiempo de espectrometr铆a UV-Vis para el monitoreo en l铆nea de la calidad de agua en sistemas urbanos de saneamiento en operaci贸n. Cinco series de tiempo de absorbancia UV-Vis obtenidas en l铆nea en diferentes sitios fueron utilizadas, con un total de 5705 espectros de absorbancia UV-Vis: cuatro sitios experimentales en Colombia (Planta de Tratamiento de Aguas Residuales (PTAR) El-Salitre, PTAR San Fernando, Estaci贸n Elevadora de Gibraltar y un Humedal Construido/Tanque de Almacenamiento) y un sitio en Austria (Graz-West R05 Catchment outlet). El proceso propuesto completo consta de etapas a ser aplicadas a las series de tiempo de absorbancia UV-Vis y son: (i) entradas, series de tiempo de absorbancia UV-Vis,(ii) pre-procesamiento de las series de tiempo, an谩lisis de outliers, completar los valores ausentes y reducci贸n de la dimensionalidad,y (iii) procedimientos de pron贸stico y evaluaci贸n de los resultados. La metodolog铆a propuesta fue aplicada a la series de tiempo con diferentes caracter铆sticas (absorbancia), esta consiste del enventaneo Winsorising como paso para la remoci贸n de outliers y la aplicaci贸n de la transformada discreta de Fourier (DFT) para reemplazar valores ausentes. Los nuevos valores reemplazando o los outliers o los valores ausentes presentan la misma o al menos la misma forma de la serie de tiempo original, permitiendo una visi贸n macro en la coherencia de la serie de tiempo. La reducci贸n de la dimensionalidad en las series de tiempo de absorbancia multivariadas permite obtener menor n煤mero de variables a ser procesadas: el an谩lisis por componentes principales (PCA) como transformaci贸n lineal captura m谩s del 97% de la variabilidad en cada serie de tiempo (en un rango de una a seis, dependiendo del comportamiento de la series de tiempo absorbancia) y el proceso de Clustering (k-means) combinado con cadenas de Markov. Los procedimientos de pron贸stico basados en se帽ales peri贸dicas como la DFT, Chebyshev, Legendre y Regresi贸n Polinomial fueron aplicados y estos pueden capturar el comportamiento din谩mico de las series de tiempo. Algunas t茅cnicas de aprendizaje de m谩quina fueron probadas y fue posible capturar el comportamiento de las series de tiempo en la etapa de calibraci贸n, los valores de pron贸stico pueden seguir el comportamiento general comparado con los valores observados (excepto ANFIS, GA y Filtro de Kalman). Por lo tanto, ANN y SVM tiene buen rendimiento de pron贸stico para la primer parte del horizonte de pron贸stico (2 horas). La evaluaci贸n de cada metodolog铆a de pron贸stico fue realizada utilizando cuatro indicadores estad铆sticos tales como porcentaje absoluto de error (APE), incertidumbre extendida (EU), conjunto de valores dentro del intervalo de confianza (CI) y suma de valores de incertidumbre extendida m谩s el conjunto de valores dentro del intervalo de confianza. El rendimiento de los indicadores provee informaci贸n acerca de los resultados de pron贸stico multivariado con el fin de estimar y evaluar los tiempos de pron贸stico para cierta metodolog铆a de pron贸stico y determinar cu谩l metodolog铆a de pron贸stico es mejor adaptada a diferentes rangos de longitudes de onda (espectros de absorbancia) para cada serie de tiempo de absorbancia UV-Vis en cada sitio de estudio. Los resultados en la comparaci贸n de las diferentes metodolog铆as de pron贸stico, resaltan que no es posible obtener la mejor metodolog铆a de pron贸stico, porque todas las metodolog铆as de pron贸stico propuestas podr铆an generar un amplio n煤mero de valores que permitir谩n complementar cada una con las otras para diferentes pasos de tiempo de pron贸stico y en diferentes rangos del espectro (UV y/o Vis). Por lo tanto, es propuesto un sistema h铆brido que es basado en siete metodolog铆as de pron贸stico. As铆, los valores de los espectros de absorbancia pronosticados fueron transformados a los correspondientes indicadores de calidad de agua (WQI) para utilizaci贸n en la pr谩ctica. Los resultados de pron贸stico multivariado presentan valores bajos de APE comparados con los resultados de pron贸stico univariado utilizando directamente los valores WQI observados. Estos resultados, probablemente, son obtenidos porque el pron贸stico multivariado incluye la correlaci贸n presente en todo el rango de los espectros de absorbancia (se captura de forma completa o al menos gran parte de la variabilidad de las series de tiempo),una longitud de onda interfiere con otra u otras longitudes de onda. Finalmente, los resultados obtenidos para el humedal construido/tanque de almacenamiento presentan que es posible obtener apreciables resultados de pron贸stico en t茅rminos de tiempos de detecci贸n para eventos de lluvia. Adicionalmente, la inclusi贸n de variables como escorrent铆a (nivel de agua para este caso) mejora substancialmente los resultados de pron贸stico de la calidad del agua. El monitoreo de contaminantes en sistemas de saneamiento urbano es generalmente realizado por medio de campa帽as de muestreo, las muestras deben ser transportadas, almacenadas y analizadas en laboratorio. Sin embargo, los desarrollos en 贸ptica y electr贸nica han permitido su fusi贸n y aplicaci贸n en la espectrometr铆a UV-Vis. Los sensores UV-Vis tienen como prop贸sito determinar la din谩mica de las cargas de materia org谩nica (Demanda Qu铆mica de Oxigeno DQO y Demanda Bioqu铆mica de Oxigeno DBO5), nitratos, nitritos y S贸lidos Suspendidos Totales (SST). Adicionalmente a los m茅todos aplicados para la calibraci贸n de los sensores y el an谩lisis las series de tiempo de los espectros de absorbancias UV-Vis, es necesario desarrollar m茅todos de pron贸stico con el fin de ser utilizada en control de monitoreo en l铆nea en tiempo real. La informaci贸n proveniente de los datos recolectados puede ser utilizada para la toma de decisiones y en aplicaciones de control de tiempo real. Realizar pron贸sticos es importante en procesos de toma de decisiones. Por lo tanto, el objetivo de este trabajo de investigaci贸n fue desarrollar uno o varios m茅todos de pron贸stico que puedan ser aplicados a series de tiempo de espectrometr铆a UV-Vis para el monitoreo en l铆nea de la calidad de agua en sistemas urbanos de saneamiento en operaci贸n. Cinco series de tiempo de absorbancia UV-Vis obtenidas en l铆nea en diferentes sitios fueron utilizadas, con un total de 5705 espectros de absorbancia UV-Vis: cuatro sitios experimentales en Colombia (Planta de Tratamiento de Aguas Residuales (PTAR) El-Salitre, PTAR San Fernando, Estaci贸n Elevadora de Gibraltar y un Humedal Construido/Tanque de Almacenamiento) y un sitio en Austria (Graz-West R05 Catchment outlet). El proceso propuesto completo consta de etapas a ser aplicadas a las series de tiempo de absorbancia UV-Vis y son: (i) entradas, series de tiempo de absorbancia UV-Vis,(ii) pre-procesamiento de las series de tiempo, an谩lisis de outliers, completar los valores ausentes y reducci贸n de la dimensionalidad,y (iii) procedimientos de pron贸stico y evaluaci贸n de los resultados. La metodolog铆a propuesta fue aplicada a la series de tiempo con diferentes caracter铆sticas (absorbancia), esta consiste del enventaneo Winsorising como paso para la remoci贸n de outliers y la aplicaci贸n de la transformada discreta de Fourier (DFT) para reemplazar valores ausentes. Los nuevos valores reemplazando o los outliers o los valores ausentes presentan la misma o al menos la misma forma de la serie de tiempo original, permitiendo una visi贸n macro en la coherencia de la serie de tiempo. La reducci贸n de la dimensionalidad en las series de tiempo de absorbancia multivariadas permite obtener menor n煤mero de variables a ser procesadas: el an谩lisis por componentes principales (PCA) como transformaci贸n lineal captura m谩s del 97% de la variabilidad en cada serie de tiempo (en un rango de una a seis, dependiendo del comportamiento de la series de tiempo absorbancia) y el proceso de Clustering (k-means) combinado con cadenas de Markov. Los procedimientos de pron贸stico basados en se帽ales peri贸dicas como la DFT, Chebyshev, Legendre y Regresi贸n Polinomial fueron aplicados y estos pueden capturar el comportamiento din谩mico de las series de tiempo. Algunas t茅cnicas de aprendizaje de m谩quina fueron probadas y fue posible capturar el comportamiento de las series de tiempo en la etapa de calibraci贸n, los valores de pron贸stico pueden seguir el comportamiento general comparado con los valores observados (excepto ANFIS, GA y Filtro de Kalman). Por lo tanto, ANN y SVM tiene buen rendimiento de pron贸stico para la primer parte del horizonte de pron贸stico (2 horas). La evaluaci贸n de cada metodolog铆a de pron贸stico fue realizada utilizando cuatro indicadores estad铆sticos tales como porcentaje absoluto de error (APE), incertidumbre extendida (EU), conjunto de valores dentro del intervalo de confianza (CI) y suma de valores de incertidumbre extendida m谩s el conjunto de valores dentro del intervalo de confianza. El rendimiento de los indicadores provee informaci贸n acerca de los resultados de pron贸stico multivariado con el fin de estimar y evaluar los tiempos de pron贸stico para cierta metodolog铆a de pron贸stico y determinar cu谩l metodolog铆a de pron贸stico es mejor adaptada a diferentes rangos de longitudes de onda (espectros de absorbancia) para cada serie de tiempo de absorbancia UV-Vis en cada sitio de estudio. Los resultados en la comparaci贸n de las diferentes metodolog铆as de pron贸stico, resaltan que no es posible obtener la mejor metodolog铆a de pron贸stico, porque todas las metodolog铆as de pron贸stico propuestas podr铆an generar un amplio n煤mero de valores que permitir谩n complementar cada una con las otras para diferentes pasos de tiempo de pron贸stico y en diferentes rangos del espectro (UV y/o Vis). Por lo tanto, es propuesto un sistema h铆brido que es basado en siete metodolog铆as de pron贸stico. As铆, los valores de los espectros de absorbancia pronosticados fueron transformados a los correspondientes indicadores de calidad de agua (WQI) para utilizaci贸n en la pr谩ctica. Los resultados de pron贸stico multivariado presentan valores bajos de APE comparados con los resultados de pron贸stico univariado utilizando directamente los valores WQI observados. Estos resultados, probablemente, son obtenidos porque el pron贸stico multivariado incluye la correlaci贸n presente en todo el rango de los espectros de absorbancia (se captura de forma completa o al menos gran parte de la variabilidad de las series de tiempo),una longitud de onda interfiere con otra u otras longitudes de onda. Finalmente, los resultados obtenidos para el humedal construido/tanque de almacenamiento presentan que es posible obtener apreciables resultados de pron贸stico en t茅rminos de tiempos de detecci贸n para eventos de lluvia. Adicionalmente, la inclusi贸n de variables como escorrent铆a (nivel de agua para este caso) mejora substancialmente los resultados de pron贸stico de la calidad del agua.The monitoring of pollutants in urban sewer systems is generally conducted by sampling campaigns, and the resulting samples must be transported, stored and analyzed in laboratory. However, the developments in optics and electronics have enabled the merge of them into the UV-Vis Spectrometry. UV-Vis probes have the purpose of determining the dynamics of loads of organic materials (i.e. Chemical Oxygen Demand (COD) and Biochemical Oxygen Demand (BOD5)), nitrates, nitrites and Total Suspended Solids (TSS). In addition to the methods used for the calibration of the probes and the analysis of the time series of UV-Vis absorbance spectra, it is necessary to develop forecasting methods in order to use the online control monitoring in real time. The information from the collected data can also be used for decision making purposes and for real-time control applications. Forecasting is important for decision-making processes. Therefore, the objective of this research work was to develop either a forecasting method or forecasting methods applied to UV-Vis spectrometry time series data for online water quality monitoring in operating urban sewer systems. Five UV-Vis Absorbance time series collected at different on-line measurement sites were used, for a total of 5705 UV-Vis absorbance spectra data: four sites in Colombia (El-Salitre Wastewater Treatment Plant-WWTP, San Fernando WWTP, Pumping Station (PS) sewage called Gibraltar and constructed-wetland/reservoir-tank (CWRT)) and one site in Austria (Graz-West R05 Catchment outlet). The complete process proposed to be applied to UV-Vis absorbance time series has several stages and these are: (i) inputs, the UV-Vis absorbance time series,(ii) the time series pre-processing, outliers analysis, complete missing values and time series dimensionality reduction,and (iii) forecasting procedures and evaluation of results. The methodology proposed was applied to the time series with different characteristics (absorbance), this consists of Winsorising as a step in outlier removal and the application of the Discrete Fourier Transform (DFT) to complete the missing values. The new values replaced either outliers or missing values present the same, or almost the same, shape as the original time series, granted the macro vision of the time series coherence. Dimensionality reduction of multivariate absorbance time series allows to have less variables to be processed: PCA linear transformation captures more than 97% of variability for each time series (PC ranging from one to six, depending on absorbance time series behavior), and Clustering process (k-means) combined with Markov Chains. Forecasting procedures based on periodic signals as DFT, Chebyshev, Legendre and Polynomial Regression were applied and they can capture the dynamic behaviour of the time series. Several Machine Learning technics were tested and it was possible to capture the behaviour of the time series at calibration stage, the forecasting obtained val煤es can follow the general behaviour compared with observed val煤es (with exception of ANFIS, GA and Kalman Filter). Therefore, ANN and SVM have good forecasting performances for first part of forecasting horizon (2 hours). The evaluation of each forecasting methodology was done using four statistic indicators as Absolute Percentage Error (APE), Extended Uncertainty (EU), Set of observed values within Confidence Interval (CI) and sum of EU and Set of observed values within CI. The performance indicators provided valuable information about multivariate forecasting results to estimate and evaluate the forecasting time for a given forecasting methodology and determine which forecasting methodology is best suited for different wavelength ranges (absorbance spectra) at each study site s UV-Vis absorbance time series. Results from different comparison of several forecasting methodologies, highlight that there is not possibility to have a best forecasting methodology among the proposed ones, because all of them could provide a wide forecasting values that would complemented each other for different forecasting time steps and spectra range (UV and/or Vis). Therefore, it is proposed a hybrid system that is based on seven forecasting methodologies. Thus, the forecasted absorbance spectra were transformed to Water Quality Indicators (WQI) for practical uses. The multivariate forecasting results show lower APE values compared to the univariate forecasting results (APE values) using the observed WQI. These results, probably, were obtained because multivariate forecasting includes the correlation presented at whole absorbance spectra range (captures complete or at least great part of time series variability),one wavelength interferes with another and/or other wavelengths. Finally, the results obtained for a constructed-wetland/reservoir-tank system show that it is possible to obtain valuable forecasting results in terms of time detection for some rainfall events. In addition, the inclusion of runoff variables (water level in this case) improves the water quality forecasting results.Doctor en Ingenier铆aDoctorad

    GVSU Press Releases, 1971

    Get PDF
    A compilation of press releases for the year 1971 submitted by University Communications (formerly News & Information Services) to news agencies concerning the people, places, and events related to Grand Valley State University
    corecore