2 research outputs found
Análisis exploratorio del comportamiento de datos cambiantes en el tiempo usando tópicos avanzados de álgebra lineal
En la actualidad, el análisis de datos dinámicos o variantes en el tiempo es de altÃsimo interés en la ciencia y la tecnologÃa, y es de gran utilidad en diversas aplicaciones, tales como: predicción, análisis de vÃdeo, segmentación automática de movimiento, entre otras. Particularmente, las técnicas de reconocimiento de patrones, en especial, aquellas basadas en análisis espectral y álgebra de matrices han mostrado ser una buena alternativa. Sin embargo, aún existe un amplio abanico de problemas sin resolver relacionados con la precisión y la interpretación de los segmentos de movimiento. Esta tesis de maestrÃa presenta un estudio sobre el uso en análisis de datos cambiantes en el tiempo de una técnica de reconocimiento de patrones no supervisada, denominada agrupamiento espectral basado en kernels (kernel spectral clustering, en inglés). EspecÃficamente, se estudia la posibilidad de construir un vector de seguimiento que se encarga de segmentar automáticamente movimientos en una secuencia de cuadros de un vÃdeo, el cual comprueba su utilidad en la identificación de inicio y fin de movimientos en objetos rotativos y curvas de nivel en movimiento. Con el desarrollo de este trabajo se comprueba también el beneficio de las propiedades, la optimización y el álgebra de funciones con matrices para el análisis de datos dinámico
Robust unsupervised learning using kernels
This thesis aims to study deep connections between statistical robustness and machine learning techniques, in particular, the relationship between some particular kernel (the Gaussian kernel) and the robustness of kernel-based learning methods that use it. This thesis also presented that estimating the mean in the feature space with the RBF kernel, is like doing robust estimation of the mean in the data space with the Welsch M-estimator. Based on these ideas, new robust kernel to machine learning algorithms are designed and implemented in the current thesis: Tukey’s, Andrews’ and Huber’s robust kernels which each one corresponding to Tukey’s, Andrews’ and Huber’s M-robust estimator, respectively. On the one hand, kernel-based algorithms are an important tool which is widely applied to different machine learning and information retrieval problems including: clustering, latent topic analysis, recommender systems, image annotation, and contentbased image retrieval, amongst others. Robustness is the ability of a statistical estimation method or machine learning method to deal with noise and outliers. There is a strong theory of robustness in statistics; however, it receives little attention in machine learning. A systematic evaluation is performed in order to evaluate the robustness of kernel-based algorithms in clustering showing that some robust kernels including Tukey’s and Andrews’ robust kernels perform on par to state-of-the-art algorithmsResumen: Esta tesis apunta a mostrar la profunda relación que existe entre robustez estadÃstica y técnicas de aprendizaje de maquina, en particular, la relación entre algunos tipos de kernels (kernel Gausiano) y la robustez de los métodos basados en kernels. Esta tesis también presenta que la estimación de la media en el espacio de caracterÃsticas con el kernel rbf, es como hacer estimación de la media en el espacio de los datos con el m-estimador de Welsch. Basado en las ideas anteriores, un conjunto de nuevos kernel robustos son propuestos y diseñdos: Tukey, Andrews, y Huber kernels robustos correspondientes a los m-estimadores de Tukey, Andrews y Huber respectivamente. Por un lado, los algoritmos basados en kernel es una importante herramienta aplicada en diferentes problemas de aprendizaje automático y recuperación de información, incluyendo: el agrupamiento, análisis de tema latente, sistemas de recomendación, anotación de imágenes, recuperación de informacion, entre otros. La robustez es la capacidad de un método o procedimiento de estimación aprendizaje estadÃstico automatico para lidiar con el ruido y los valores atÃpicos. Hay una fuerte teorÃa de robustez en estadÃstica, sin embargo, han recibido poca atención en aprendizaje de máquina. Una evaluación sistemática se realiza con el fin de evaluar la robustez de los algoritmos basados en kernel en tareas de agrupación mostrando que algunos kernels robustos incluyendo los kernels de Tukey y de Andrews se desempeñan a la par de los algoritmos del estado del arte.MaestrÃ